Clap de fin

Le projet s'achève enfin 😀 Beaucoup de choses se sont passées depuis le dernier article, en voici un bref aperçu (liste non-exhaustive à l'intention des ingénieurs linguistes en herbe) : - l'analyse avec le Trameur : aaah le Trameur! Serge Fleury nous en offre gracieusement le mode d'emploi, encore faut-il se familiariser avec les boutons, …

Lire la suite de Clap de fin

Un premier pas vers le Trameur

Le fameux travail avec l'outil Trameur approche! Avant de plonger dans le vif du sujet, on prépare le terrain pour l'analyse et on crée une nouvelle colonne dans le tableau, appelée index. L'index de chaque url montre la liste de tous les mots employés dans le dump et leur fréquence (à cette étape on commence …

Lire la suite de Un premier pas vers le Trameur

Les tableaux – épisode 2

Les expressions régulières fonctionnent pour chaque langue, il est maintenant temps de les rassembler et d'admirer le programme créer les trois tableaux tout seul comme un grand. C'était trop beau pour être vrai. Les expressions régulières reconnaissait au départ plus de mots qu'elles ne le devraient. Ainsi, en albanais, elle reconnaissait le mot adoleshentet. J'ai …

Lire la suite de Les tableaux – épisode 2

Les tableaux – épisode 1

Miracle! Après des heures à me demander pourquoi ça ne fonctionne pas quelques modifications, le code fonctionne enfin. Dans mon fichier parametres j'ai utilisé l'expression régulière [Ll]esh(i|it)? afin de rechercher lesh, leshi, leshit, Lesh, Leshi, et Leshit dans le dump. Problème rencontré :  la commande curl renvoyait au début la valeur 000 (quelle idée !) …

Lire la suite de Les tableaux – épisode 1

Petites modifications

Nous avons vu en cours comment résoudre l'affichage de nos tableaux en ajoutant la balise <meta charset = utf - 8> lors de la création du tableau html. Bien sûr, c'est loin d'être parfait. Il reste à traiter les problèmes d'encodage à l'aide des nouvelles commandes vues en cours (curl, file, iconv). Au boulot!

Le code, ce joyeux casse-tête

Avant de plonger nos jolies petites mains dans le cambouis, nous avons réalisé le schéma algorithmique de notre futur programme (histoire  de mourir devant toutes ces lignes incompréhensibles comprendre ce que nous devons faire). Nous avons décomposé le code en trois étapes. La première étape est la lecture des paramètres. Notons que nous avons légèrement …

Lire la suite de Le code, ce joyeux casse-tête

Pour bien commencer

On progresse tout doucement. Il faut maintenant créer l'arborescence de travail nécessaire au projet. Après s’être placé dans le bon répertoire de travail, on crée un nouveau répertoire appelé PROJET-MOT-SUR-LE-WEB et on vérifie si le répertoire a bien été créé avec la commande ls : On se déplace dans le répertoire PROJET-MOT-SUR-LE-WEB et on exécute ensuite le script …

Lire la suite de Pour bien commencer

Un monde de commandes

Certes, un peu effrayant au début. Cette première appréhension passée, on peut commencer à s'exercer! Après s'être déplacé dans le bon répertoire de travail, on exécute les commandes suivantes : mkdir TEST1 mkdir TEST2 mkdir TEST3 ls cd TEST1 touch vide1.txt ../TEST1/vide2.txt ../TEST2/vide3.txt echo «morgane» > vide1.txt echo «laine» >> vide1.txt mv vide1.txt jenesuisplusvide.txt cp jenesuisplusvide.txt ../TEST2 …

Lire la suite de Un monde de commandes