Styles

samedi 29 janvier 2011

Comment créer un flux RSS à partir de n'importe quelle page Web

Le service StackOverflow.com a cela de magnifique qu'il permet de faire émerger de l'ensemble vague et indistinct des interrogations que se posent les informaticiens entre eux, les meilleurs questions et les meilleures réponses à celles-ci. Nombreuses sont, pourtant les questions sans intérêts ou trop particulières pour être bénéfique aux lecteurs curieux. La plupart du temps ces questions trouvent leur réponse dans les manuels de référence en ligne de chaque outil. Un simple RTFM suffirait, mais, bonté de la nature humaine, des âmes charitables prennent le temps de former les nouveaux venus à l'informatique. C'est aussi et surtout pour faire monter leur compteur de réputation. Ce n'est pas un mal en soi de pouvoir conjuguer vanité des uns et ignorance des autres et qu'en jaillisse une vérité.

Tous les sujets imaginables sont abordés, il faut donc s'exercer à rechercher finement ce qui est intéressant pour soi-même sans être submergé par des questions qui ne nous concerne pas. L'outil de recherche de stackoverflow est puissant, il permet de faire une recherche par tag (en saisissant [python] par exemple), de ne choisir que les questions qui ont un nombre de votes supérieur à une valeur (par exemple vote:5), etc. La FAQ sur les options de recherche est ici la bienvenue.

Pour pouvoir m'instruire à parler couramment le python, j'ai entrepris de consulter régulièrement les meilleurs questions et réponses concernant ce langage. Pour ce faire, stackoverflow.com ne permettant pas d'avoir de flux RSS correspondant à une recherche particulière, je me suis construit mon propre flux RSS grâce à l'outil en ligne feed43.com. Ce service permet de récupérer le code source d'une page web et d'en extraire du contenu grâce à des modèles de correspondance (matching patterns). On peut ensuite mettre en forme ce contenu dans un flux RSS qu'on pourra réutiliser dans n'importe quel lecteur de flux RSS. Feed43.com va régulièrement consulter la page Web en question et va mettre à jour le flux RSS en conséquence. Et voilà, on a donc les moyens de créer des flux RSS pour n'importe quelle page/service du web qui n'en propose pas.

Par exemple, je me suis créé un flux RSS rassemblant de bonnes questions (votes >= 5) sur python ([python]) ayant une réponse acceptée par l'auteur de la question (hasaccepted:1) et n'étant pas fermée pour diverses causes (closed:0). Dans feed43.com, j'ai configuré le flux de cette manière :
Je peux maintenant avoir dans mon lecteur de flux RSS préféré, les meilleures questions python avec réponse.

Grâce à feed43 je me suis constitué quelques flux RSS à partir de sites web qui n'en proposent pas, notamment pour analyser des résultats de recherche sur pajemploi (pour avoir les changements dans les salaires minimum en vigueur), sur ZDnet (pour n'avoir que les news Open Source)... Ce service est bien sûr dépendant des modifications des pages consultés : votre flux ne marchera plus si les pages scrutés ont été refondues.

Aucun commentaire: