le regole per un aggregatore e la necessità di uno standard

Queste sono, a mio avviso, le regole che dovrebbe darsi chi fa dei siti che “aggregano” post o articoli.

  1. Chiedere il permesso all’intestatario del sito che si intende aggregare.

    E’ buona norma chiedere il permesso, specificando come verrà fatta l’aggregazione (Esempio: intendo prendere i primi 100 caratteri del post, il primo paragrafo, prenderò o meno le foto, etc.)

  2. Monitorizzare tutti gli articoli aggregati: se il sito origine per qualche motivo li cancella, vanno cancellati anche sull’aggregatore.

    Se la url dell’articolo aggregato torna 404 l’articolo va cancellato entro 12 ore

  3. Non far commentare gli articoli sull’aggregatore

    Ammesso linkare la form dei commenti, se presente, nella pagina originale. Perchè il mio articolo dovrebbe poter essere commentato da un’altra parte ?

  4. Esporre in modo chiaro le modalità di rimozione o di aggiunta di una fonte.

    Il titolare della fonte “aggregata” dovrebbe avere associato un account di amministrazione sull’aggregatore: in questo modo potrà in totale autonomia operare sui suoi post: esempio cancellarne uno che non vuole che sia aggregato.

Chi invece produce contenuti, che siano testate online o blogger, dovrebbe esporre in una pagina se o meno intende essere aggregato e con che modalità:
Esempio “Il contenuto di questo sito può essere riprodotto in un “aggregatore” usando il feed rss ma prendendo solo il titolo”, oppure “Il contenuto di questo sito non può essere riprodotto in aggregatori”, etc.

Occorrerebbe poi usare correttamente il file robots.txt.
L’aggregatore legge il robots.txt e si comporta di conseguenza, così come fanno (o dovrebbero fare) i bot dei motori di ricerca.
Chi detiene il sito se non vuole essere aggregato dall’aggregatore “X” basta che scriva nel robots.txt “Disallow” seguito dallo User Agent dell’aggregatore, oppure il pattern delle url che non vuole siano aggregate.

La soluzione a tutto questo potrebbe essere quella di usare uno standard con il quale possano essere specificate le modalità di aggregazione, in questo modo si eviterebbero sicuramente malintesi e si darebbe un servizio migliore.

Si potrebbero estendere i feed ( atom / rss ) con un namespace ad hoc nel quale verrebbero specificate le informazioni di aggregazione, globali ma anche per singolo post.
Probabilmente la via più rapida affinchè tale proposta possa diventare uno standard è quella che venga definita e implementata in una piattaforma di blogging molto diffusa.

  • No Related Post