Wednesday, April 24, 2013

Flickr Meta-Data Crawling

Nachdem es ein paar Nachfragen zur Data Crawling Aufgabe gab, hier noch einmal in Stichpunkte, was zu tun ist:

  • mittels der Flickr API sollen alle für die Aufgabe im Seminar relevanten Metadaten, die zu den Photos des MIRFLICKR-1M Datensatzes existieren, eingesammelt werden (z.B. Title, Descriptions, User Comments, Gruppeninformationen, ... schaut bitte in die API Description, was es noch so gibt und einigt euch auf ein gemeinsames Set)
  • einigt euch für die Serialisierung auf ein gemeinsames Datenformat, damit später alle Gruppen auf die so gesammelten Metadaten zugreifen können
  • sammelt alle Photos (per MIRFLICKR-Id), die auf Flickr nicht mehr verfügbar sind oder zu denen ihr keine Flickr Photo-Id in den license Files finden könnt

1 comment:

  1. Es gibt einen ersten Vorschlag zum Datenformat zur Diskussion im Google Drive.

    ReplyDelete