Monday, April 29, 2013

Literaturrecherche

In der Tabelle sind noch drei Paper keine Gruppe zugeordnet. Diese sind von uns eingetragen worden, können aber gern von Euch vorgestellt werden. Sie sind jetzt grün markiert...
Außerdem haben wir ja 16 Seminarteilnehmer und bisher werden anscheinend nur 11 Paper vorgestellt. Die Studenten, die morgen nicht anwesend sein können werden idealerweise von Mitstreitern aus der Gruppe vertreten...

Plenumsveranstaltung Morgen

Nochmal zur Erinnerung:

Morgen findet die Plenumsveranstaltung zur Literaturrecherche statt:

30.04.2013, 16.00 Uhr, Raum A-2.1

Jeder stellt ein Paper vor. Dazu sollte jede Gruppe noch Crawling-Ergebnisse vorstellen - falls bereits vorhanden...

Thursday, April 25, 2013

Python Script zum Flickr Crawling

Gruppe 5 (Lukas und Tobias) hat einen Vorschlag für ein vollständigeres Flickr Script ins Google Drive gestellt. Vielen Dank dafür! Wir hatten ja bereits mehrfach erwähnt, dass sich alle Gruppen auf ein Datenformat einigen sollten, um den Austausch zu vereinfachen. Diskutiert bitte den Vorschlag der beiden auch im Hinblick auf das Format. Wir haben bei den Admins eine Mailingliste beantragt - solange diese noch nicht eingerichtet ist, nutzt bitte die "normale" Mailkommunikation. Die Namen der einzelnen Gruppenmitglieder haben wir zu den Gruppen in "MIRFLICKR-1M Gruppenzuordnungen" geschrieben.

Wednesday, April 24, 2013

Flickr Meta-Data Crawling

Nachdem es ein paar Nachfragen zur Data Crawling Aufgabe gab, hier noch einmal in Stichpunkte, was zu tun ist:

  • mittels der Flickr API sollen alle für die Aufgabe im Seminar relevanten Metadaten, die zu den Photos des MIRFLICKR-1M Datensatzes existieren, eingesammelt werden (z.B. Title, Descriptions, User Comments, Gruppeninformationen, ... schaut bitte in die API Description, was es noch so gibt und einigt euch auf ein gemeinsames Set)
  • einigt euch für die Serialisierung auf ein gemeinsames Datenformat, damit später alle Gruppen auf die so gesammelten Metadaten zugreifen können
  • sammelt alle Photos (per MIRFLICKR-Id), die auf Flickr nicht mehr verfügbar sind oder zu denen ihr keine Flickr Photo-Id in den license Files finden könnt

Monday, April 22, 2013

Literatur-Recherche und Präsentation

Aufgrund einer Nachfrage hier nochmal ein paar Stats für die erste Plenumsveranstaltung (30.04.2013, 16 Uhr) nächste Woche:

Jeder sollte ein Paper präsentieren, das irgendwie relevant für das Seminar ist.
Die Präsentation dauert 3-5 Minuten (maximal!) und zeigt die Idee der Arbeit und den Schnittpunkt zum Seminar.

Am Schluss solltet ihr noch eine Statistik zu den aktuellen Crawling-Ergebnissen der Flickr-Metadaten zeigen können.

Friday, April 19, 2013

Datensatz und FlickrFetchr

Der Basisdatensatz, der im Seminar verwendet werden soll, ist der MIRFLICKR-1M Datensatz. Informationen findet ihr hier:


In den beiden referenzierten Publikationen steht, wie die Bilder gecrawlt wurden. Das ist nicht ganz unwichtig, weil der Flickr 'Interestingness' Score natürlich einen gewissen Bias darstellt...

Ein kleines Python Script haben wir in die Materialien gestellt. Das Script zeigt, wie man die API auf Basis des 'Flickr API wrapper for Python' (python-flickrapi, Sybren A. Stüvel) verwendet. Aktuell holt das Script 'title', 'descriptions', 'tags', 'notes' (in-photo annotations) und 'comments' und schreibt alles auf die Konsole. Schaut bitte in die API und überlegt euch, was noch sinnvoll sein könnte (z.B. Gruppen Infos).

Bei Fragen und Problemen, einfach vorbeikommen: H-1.37/H-1.38

Folien zur technischen Einführung

Die Folien der heutigen technischen Einführung in das Seminarthema sind hier zu finden.

Gruppenübergreifende Organisation

Für die Literaturrecherche und weitere gruppenübergreifende Arbeiten steht dieser Google-Ordner zur Verfügung.

Der nächste Plenumstermin findet am 30.4.2013, 16 Uhr statt. Den Raum geben wir noch bekannt.

Für die Gruppeneinzelterminfindung haben wir ein Doodle aufgesetzt.
Bitte tragt Euch gruppenweise ein. Wir haben erstmal nur die ursprünglichen Seminartermine vorgegeben. Falls das für eine Gruppe gar nicht passt, müssen wir das noch individuell abstimmen.

Tuesday, April 9, 2013

Seminar Challenge

Da einige nicht beim KickOff dabei sein konnten (an dieser Stelle nochmals die Entschuldigung, dass ich übersehen hatte, den Termin vom Vorjahr zu aktualisieren...) hier kurz und knapp noch einmal die Aufgabenstellung des Seminars (Seminar Challenge):

Im Rahmen des Seminars sollen Softwarelösungen entwickelt werden, die zu den Ergebnissen einer Flickr Anfrage Cluster homogener Bilder erzeugen. Homogenität bezieht sich hierbei sowohl auf visuelle Eigenschaften der Bilder (wir werden geeignete Verfahren zur Extraktion sog. low-level Merkmale sowie Verfahren zum Bildvergleich in der technologischen Einführung zeigen) als auch auf die textuellen Metadaten, die mit Hilfe von Named Entity Mapping (auch dies werden wir in der technischen Einführung näher erläutern) auf semantischen Entitäen abgebildet werden. Ziel ist es dabei, Bildgruppen zu identifizieren, die einen guten Trade-Off zwischen visueller Varianz und Homogenität darstellen.

Einführungsfolien

Die Folien vom gestrigen KickOff sind hier zu finden.

Nochmal als Hinweis: Der nächste Termin findet am 19.4.2013, 9 Uhr statt. Bis dahin könnt ihr Euch in Gruppen zusammen finden und schonmal die Literatur, die in den Materialien zu finden ist, sichten. Darauf aufbauend habt ihr ja vielleicht erste Ideen für die Herangehensweise...

Monday, April 8, 2013

Nächster Termin und Gruppenfindung

Unser nächstes Treffen mit einer technologischen Einführung in die relevanten Bereiche aus Computer Vision, Semantic Analysis und Data Mining findet am

Freitag 19.4.2012, 9 Uhr, Raum A-2.2

statt. Bitte findet euch bis zu diesem Termin in Gruppen zu 2-3 Studenten zusammen. Wir haben euch hierfür bereits ein Doodle angelegt:

Doodle

Thursday, April 4, 2013

Semantic Multimedia

Die automatisierte Erkennung von Bildinhalten stellt eine wichtige Quelle für beschreibende Metadaten dar, damit große Archive erst durchsuchbar werden. Die hierbei eingesetzten Technologien zum Machine Learning benötigen jedoch eine große Anzahl manuell erzeugter Trainingsdaten, um Bilder in Kategorien klassifizieren zu können.

Online Photo-Communities, wie Flickr, stellen eine wertvolle Quelle für manuell verschlagwortete Bilddaten dar. Die Qualität der Schlagworte variiert jedoch stark und ist zudem abhängig von der Intention des jeweiligen Autors.

Im Rahmen des Seminars Semantic Multimedia sollen Verfahren aus den Bereichen Computer Vision, Semantic Analysis und Data Mining kombiniert werden, um Bilder mit hohem semantischen Bezug zwischen Annotationen und dargestelltem Bildinhalt zu identifizieren.

Seminarthemen

  • Automatisierte Topic Detection in Flickr Daten durch Extraktion visueller und semantischer Metadaten
  • Extraktion relevanter visueller Bildmerkmale (Feature Extraction)
  • Abbilden von textuellen Annotation auf semantische Metadaten (Named Entity Mapping)
  • Data Mining

Allgemeine Informationen


Erste Veranstaltung: 

Montag, 8. April, 11:00 Uhr


Leistungserfassung

  • Umsetzung einer vorgegebenen Implementierungsaufgabe
  • Präsentation der Ergebnisse
  • Schriftliche Ausarbeitung zum Vortragsthema