Vous pouvez contribuer simplement à Wikibéral. Pour cela, demandez un compte à adminwiki@liberaux.org. N'hésitez pas !


Wikiberal:Animation/LinkInsert

De Wikiberal
Aller à la navigation Aller à la recherche

LinkInsert est un petit programme écrit en R par V. Andrès.

LinkInsert ne concerne a priori que les personnes ayant accès à la partie wordpress de Contrepoints.

Les 2 fonctions principales de LinkInsert sont :

  • la détection dans un fichier html des mots susceptibles de constituer des liens vers des articles de wikiberal correspondants
  • de permettre l'insertion, semi-automatique, de ces liens dans un fichier texte au format html.

Sont typiquement concernés, les articles de Contrepoints.org, pour lesquels les contributeurs font actuellement cela à la main.

L'insertion est semi-automatique dans le sens où :

  • le programme affiche dans une 1° phase l'ensemble des mots et séquence de mots identifiés dans le texte comme susceptibles de constituer un lien vers une page wikiberal correspondante.
    • l'utilisateur peut très bien s'arrêter à ce stade, et réaliser l'insertion à la main s'il le souhaite
  • ensuite seulement, le programme propose, pour chaque mot, de réaliser, ou pas, l'insertion. C'est donc l'utilisateur qui reste décideur.


Intérêts

Etant donné que linkInsert se base sur une liste exhaustive de tous les articles (plus de 6000),

  • On ne risque pas/plus d'oublier d'articles
  • On s'épargne la corvée de vérifier pour chaque mot qu'on pense intéressant, s'il y a bien, ou pas, un article correspondant dans wikiberal
  • Chaque insertion de lien se fait en 1 seul clic, c'est donc bien plus rapide que toute autre méthode actuellement


Limitations

La détection des couples mot/lien pertinents n'est pas si évidente, à cause entre autres des orthographes multiples, des accentuations, des pages homonymes, etc. Pour ces raisons, il peut y avoir des mots qui ne sont pas détectés. Normalement, ils sont néanmoins peu nombreux.

LinkInsert traite les mots simples et les expressions ayant jusqu'à 5 mots. (Ce qui doit normalement permettre de couvrir 99% ou 100% des pages de wikiberal.)

Les mots directement accolés à une balise html

(eg <em>mot , mot</em> , <strong>mot , mot</strong> , etc)

ne sont actuellement pas retenus.


Requirements

  • LinkInsert est, pour le moment, un programme à utiliser exclusivement sur sa propre machine. Il faut donc avoir l'outil R d'installé (c'est gratuit et pas bien compliqué).
  • Il faut également disposer d'un éditeur de texte ascii simple, genre notepad, gedit ou autre. Normalement tout PC en 2017 est muni d'au moins un éditeur basique.
  • Il faut également avoir de disponible sur sa machine le fichier contenant tous les noms de pages de wikiberal.


Utilisation

Exemple d'utilisation typique :

  • on se place dans l'éditeur wordpress de CP, sur un article. On se place dans l'onglet texte. On fait un copier/coller de l'intégralité du texte
  • on ouvre son éditeur sur sa machine, on le copie dedans et on le sauvegarde sous le nom ArticleCP.html dans le répertoire de travail
    • NB1 : le fichier ArticleCP.html n'est pas touché ou modifié par LinkInsert
    • NB2 : LinkInsert() effectue une copie de sauvegarde, datée, du fichier ArticleCP.html (de la forme ArticleCP-Fri Jan 20 09:22:11 2017.html). Chaque article traité est donc ainsi systématiquement sauvegardé.
  • on lance le programme R et on appelle linkInsert()
  • linkInsert affiche d'abord une liste des mots susceptibles d'accueillir un lien (mots-liens), et le lien proposé correspondant
    • on peut, à ce stade, déjà se faire une idée, des mots qu'on va valider ou pas, jeter un oeil aux liens proposés, etc
    • on peut lancer LinkInsert(os=T), ie onlysearch = TRUE, et LinkInsert() s'arrête alors à la phase d'affichage des mots-liens possibles
  • ensuite, mot après mot, on lance, ou pas, l'insertion du lien correspondant.
  • une fois l'opération terminée, un fichier nommé LinkedArticleCP.html est créé
    • un commentaire est ajouté en entête du fichier de la forme :
<!-- LinkInsert: 956 mots 23 liens possibles, 14 liens insérés, ratio: 0.01 cible wikiberal.org : 2017-01-23 VA -->
<!-- réchauffement climatique Ségolène Royal 2009 2012 éducation électricité France gauche libre-échange médias presse production taxes travail -->
    • ratio = nombre de liens insérés / nombre de mots (retenus) du texte
    • la liste des mots insérés
  • on l'édite, on jette un coup d'oeil pour voir s'il n'y a pas de souci évident
  • on le copie/colle, et on le rapatrie dans l'éditeur wordpress où on le sauvegarde en lieu et place de l'article original
  • on peut évidemment toujours dans l'éditeur wordpress délier certains liens qui s'avéreraient ne pas convenir.
    • délier un lien existant se fait en 1 seul clic.

En l'état, ça reste un peu pédestre ... mais c'est quand même nettement plus rapide et complet qu'une insertion à la main.


Paramétrages

  • mincars : nombre minimal de caractères d'un lien (par défaut, mincars=3)
  • maxinsert : nombre maximal d'insertions d'un même mot/lien dans le texte (par défaut, maxinsert=3)


Liens


Next

  • l'extension aux cibles suivantes est techniquement possible :
    • Librairal et Catallaxia (mais il y a d'abord un peu de nettoyage à effectuer sur ces wikis)
    • Contrepoints, mais il faut d'abord générer une base de liens
    • ...


Suggestions/Bugs

Je suis preneur de toutes suggestions quant aux manières d'améliorer ce programme. Ainsi que tout retour concernant les bugs que vous pourriez détecter.