Friday, August 23, 2013

Finale Abgabe

Der finale Abgabetermin rückt immer näher!

Falls ihr zu der Ausarbeitung (oder sonstigem) noch Fragen habt, könnt ihr gern nächste Woche noch bei uns vorbeikommen. Zwei Gruppen waren ja schon da, die jetzt Wettbewerbsvorteil haben... ;-)

Finale Abgabe ist übrigens der

31.08.2013

Wednesday, July 10, 2013

In eigener Sache...


Finale Abgabehinweise

Nachdem wir gestern das Seminar mit so einer wirklich guten (und gemütlichen) Postersession abschließen konnten, wollen wir Euch nun noch ein paar Hinweise für die finale Abgabe der Ausarbeitung geben:

  • Abgabetermin: 31.08.2013
  • bitte schreibt nur maximal 20 Seiten (ohne Inhaltsverzeichnis, Deckblatt, Glossar etc.)
  • das Template für die Musterausarbeitung findet ihr hier - denkt daran, das Template entsprechend Eurer Arbeitsschritte (also bzgl. Überschriften) anzupassen und nicht einfach so zu übernehmen
  • ihr könnt in Deutsch oder Englisch schreiben
  • eure Software solltet ihr auch mit der Ausarbeitung fertig stellen und uns zur Verfügung stellen

Das war's soweit.

Wir wünschen Euch schöne Sommerferien! ;-)

Wednesday, July 3, 2013

Finale Evaluation

Für die Postersession am kommenden Dienstag haben wir ein kleines Evaluationsset erstellt, um die Ergebnisse der einzelnen Gruppen untereinander vergleichen zu können. Die Metadaten sind ein Subset der crawling Ergebnisse aus der 200.000-299.999 Gruppe und standen damit bisher keiner Gruppe zur Verfügung.

Bitte bereitet zur nächsten Woche Ergebnisse für die Anfrage 'food' vor und nehmt die 9203 Files aus dem Testset als Grundlage. Das Testset findet ihr unter:


Da der Datensatz vergleichsweise klein gehalten ist, steht es euch natürlich trotzdem frei, bei der Präsentation auch Ergebnisse aus den Datensets zu zeigen, mit denen ihr bisher im Seminarverlauf gearbeitet habt!

Template für Ausarbeitung

Das Template für die Ausarbeitung, das wir heute in dem Workshop vorstellen werden, könnt ihr

hier

herunterladen.

Tuesday, July 2, 2013

Grill-Doodle

Parallel zu der Postersession wollen wir zum Semesterabschluss grillen. Dafür werden extra Original Thüringer Bratwürste aus Original Thüringen beschafft. Es gibt aber auch Steaks und Veggie-Kram. Bitte markiert in dem

Doodle

bis zum Freitag, 5.07.2013

wieviel ihr essen und trinken werdet, damit wir entsprechend planen können.

Thursday, June 20, 2013

Wie man wissenschaftliche Arbeiten schreibt...

Für die Studenten unseres Bachelorseminars bieten wir eine kurze Einführung in LaTeX und wissenschaftliches Schreiben an.

Dieser Workshop wird am

3. Juli 2013, 9.45 - 10.45 Uhr, im Raum A.1-1

stattfinden.
Falls ihr daran Interesse habt, könnt ihr natürlich gern teilnehmen.

Abschlussveranstaltung - Postersession

Wie bereits am Anfang des Seminars erwähnt, werden die Ergebnisse des Seminars in einer Poster- bzw. Demosession präsentiert.

Dafür haben wir folgenden Termin festgelegt:

9. Juli 2013, 16 Uhr -

Anschließend oder je nach Wetter parallel werden wir grillen!

Wir haben den Raum Belvedere und den Pavillon hinter dem Hauptgebäude reserviert und entscheiden dann kurzfristig, wo die Postersession stattfinden wird.

Wednesday, June 5, 2013

Neue License Daten und neue Termine

Unter http://mediaglobe.yovisto.com/semmul2013 findet ihr neue tar Archive mit License Files. Wäre toll, wenn ihr eure Crawler weiter laufen lassen könntet, damit wir zum Ende des Semesters einen vollständigen Datensatz haben!
Ich habe die Files wieder Gruppen zugeordnet:

  • Gruppe 1: 60-69.tar.gz
  • Gruppe 3: 70-79.tar.gz
  • Gruppe 4: 80-89.tar.gz
  • Gruppe 5: 90-99.tar.gz
In der nächsten Woche machen wir wie gewohnt mit den Gruppeneinzeltreffen weiter!

Monday, June 3, 2013

Beispielanfragen

Um Euch eine bessere Vorstellung für mögliche Queries zu geben, für die wir am Ende des Seminars (in < 6 Wochen!) von Euch relevante Cluster haben möchten, hier ein paar Beispiele:

  • food
  • mirror
  • africa
  • bridge
  • car 
Bis morgen im Plenum!

Friday, May 31, 2013

Plenum am 4.6.2013

Wie in den Gruppenterminen angekündigt ist unsere nächste Plenumsveranstaltung in der kommenden Woche:

4.6.2013, 16-17.30Uhr, A-2.1

Bitte bereitet dazu eine kurze Präsentation pro Gruppe vor, in der ihr die aktuellen Clusterergebnisse präsentiert, euren Ansatz mit den anderen Gruppen diskutiert und eure nächsten Schritte plant.

Wednesday, May 15, 2013

Nächste Termine

Wie gestern besprochen, möchten wir euch einen kurzen Überblick über die von uns extrahierten SURF und GIST Deskriptoren geben. Dafür bieten wir für

Dienstag, 21.5.2013, 16.00Uhr in A-2.1

einen freiwilligen Zusatztermin an, für alle Gruppen, die für ihren Ansatz SURF bzw. GIST auf Anwendbarkeit evaluieren wollen.

In der darauffolgenden Woche finden am 27.5. und 28.5. die nächsten Einzeltermine (zu den bekannten Uhrzeiten) statt, zu denen wir gerne schon erste Ergebnisse von euch sehen möchten!

Sunday, May 12, 2013

Nächste Plenumsverstaltung

Zur nächsten Plenumsveranstaltung

14.5.2013, 16 Uhr , Raum A-2.1

bereitet ihr bitte folgende Themen vor:

  • Vorstellung Eurer (überarbeiteten) Strategie
  • Bewertung der von Euch überprüften Features
  • Status Metadaten-Crawling
Ihr sollt Eure Strategien in der großen Runde diskutieren. Eventuell gibt es ja Kritikpunkte oder Verbesserungsvorschläge. Alles natürlich trotzdem mit dem Ziel, dass jede Gruppe eine andere Vorgehensweise verfolgt.

Bis morgen!

Thursday, May 2, 2013

Termine für Gruppeneinzeltreffen

Die Termine für die Einzeltreffen für jede Gruppe stehen jetzt fest:

  • Gruppe 5: Mo, 11 Uhr
  • Gruppe 1: Mo, 12 Uhr
  • Gruppe 3: Di, 13 Uhr
  • Gruppe 4: Di, 13.30 Uhr


Die Treffen finden im Büro von Harald Sack statt (H-1.39).

Bereitet bitte zum ersten Treffen eine Präsentation eurer Strategie vor, wie ihr die Aufgabenstellung im Semiar lösen wollt. Darüber hinaus schaut euch bitte die einzelnen im Datensatz bereitgestellten Features auf Reproduzierbarkeit an (stichprobenartig!). Hierzu nochmal der Hinweis zu (uns bekannten) Feature Extraction Tools:




Diese Toolkits sind ein sinnvoller erster Versuch - googlen schadet trotzdem nicht! Informiert euch auch über die grundsätzliche Arbeitsweise der einzelnen Verfahren.

Wie immer gilt: falls Probleme oder Fragen auchtauchen, kommt einfach vorbei!

Monday, April 29, 2013

Literaturrecherche

In der Tabelle sind noch drei Paper keine Gruppe zugeordnet. Diese sind von uns eingetragen worden, können aber gern von Euch vorgestellt werden. Sie sind jetzt grün markiert...
Außerdem haben wir ja 16 Seminarteilnehmer und bisher werden anscheinend nur 11 Paper vorgestellt. Die Studenten, die morgen nicht anwesend sein können werden idealerweise von Mitstreitern aus der Gruppe vertreten...

Plenumsveranstaltung Morgen

Nochmal zur Erinnerung:

Morgen findet die Plenumsveranstaltung zur Literaturrecherche statt:

30.04.2013, 16.00 Uhr, Raum A-2.1

Jeder stellt ein Paper vor. Dazu sollte jede Gruppe noch Crawling-Ergebnisse vorstellen - falls bereits vorhanden...

Thursday, April 25, 2013

Python Script zum Flickr Crawling

Gruppe 5 (Lukas und Tobias) hat einen Vorschlag für ein vollständigeres Flickr Script ins Google Drive gestellt. Vielen Dank dafür! Wir hatten ja bereits mehrfach erwähnt, dass sich alle Gruppen auf ein Datenformat einigen sollten, um den Austausch zu vereinfachen. Diskutiert bitte den Vorschlag der beiden auch im Hinblick auf das Format. Wir haben bei den Admins eine Mailingliste beantragt - solange diese noch nicht eingerichtet ist, nutzt bitte die "normale" Mailkommunikation. Die Namen der einzelnen Gruppenmitglieder haben wir zu den Gruppen in "MIRFLICKR-1M Gruppenzuordnungen" geschrieben.

Wednesday, April 24, 2013

Flickr Meta-Data Crawling

Nachdem es ein paar Nachfragen zur Data Crawling Aufgabe gab, hier noch einmal in Stichpunkte, was zu tun ist:

  • mittels der Flickr API sollen alle für die Aufgabe im Seminar relevanten Metadaten, die zu den Photos des MIRFLICKR-1M Datensatzes existieren, eingesammelt werden (z.B. Title, Descriptions, User Comments, Gruppeninformationen, ... schaut bitte in die API Description, was es noch so gibt und einigt euch auf ein gemeinsames Set)
  • einigt euch für die Serialisierung auf ein gemeinsames Datenformat, damit später alle Gruppen auf die so gesammelten Metadaten zugreifen können
  • sammelt alle Photos (per MIRFLICKR-Id), die auf Flickr nicht mehr verfügbar sind oder zu denen ihr keine Flickr Photo-Id in den license Files finden könnt

Monday, April 22, 2013

Literatur-Recherche und Präsentation

Aufgrund einer Nachfrage hier nochmal ein paar Stats für die erste Plenumsveranstaltung (30.04.2013, 16 Uhr) nächste Woche:

Jeder sollte ein Paper präsentieren, das irgendwie relevant für das Seminar ist.
Die Präsentation dauert 3-5 Minuten (maximal!) und zeigt die Idee der Arbeit und den Schnittpunkt zum Seminar.

Am Schluss solltet ihr noch eine Statistik zu den aktuellen Crawling-Ergebnissen der Flickr-Metadaten zeigen können.

Friday, April 19, 2013

Datensatz und FlickrFetchr

Der Basisdatensatz, der im Seminar verwendet werden soll, ist der MIRFLICKR-1M Datensatz. Informationen findet ihr hier:


In den beiden referenzierten Publikationen steht, wie die Bilder gecrawlt wurden. Das ist nicht ganz unwichtig, weil der Flickr 'Interestingness' Score natürlich einen gewissen Bias darstellt...

Ein kleines Python Script haben wir in die Materialien gestellt. Das Script zeigt, wie man die API auf Basis des 'Flickr API wrapper for Python' (python-flickrapi, Sybren A. Stüvel) verwendet. Aktuell holt das Script 'title', 'descriptions', 'tags', 'notes' (in-photo annotations) und 'comments' und schreibt alles auf die Konsole. Schaut bitte in die API und überlegt euch, was noch sinnvoll sein könnte (z.B. Gruppen Infos).

Bei Fragen und Problemen, einfach vorbeikommen: H-1.37/H-1.38

Folien zur technischen Einführung

Die Folien der heutigen technischen Einführung in das Seminarthema sind hier zu finden.

Gruppenübergreifende Organisation

Für die Literaturrecherche und weitere gruppenübergreifende Arbeiten steht dieser Google-Ordner zur Verfügung.

Der nächste Plenumstermin findet am 30.4.2013, 16 Uhr statt. Den Raum geben wir noch bekannt.

Für die Gruppeneinzelterminfindung haben wir ein Doodle aufgesetzt.
Bitte tragt Euch gruppenweise ein. Wir haben erstmal nur die ursprünglichen Seminartermine vorgegeben. Falls das für eine Gruppe gar nicht passt, müssen wir das noch individuell abstimmen.

Tuesday, April 9, 2013

Seminar Challenge

Da einige nicht beim KickOff dabei sein konnten (an dieser Stelle nochmals die Entschuldigung, dass ich übersehen hatte, den Termin vom Vorjahr zu aktualisieren...) hier kurz und knapp noch einmal die Aufgabenstellung des Seminars (Seminar Challenge):

Im Rahmen des Seminars sollen Softwarelösungen entwickelt werden, die zu den Ergebnissen einer Flickr Anfrage Cluster homogener Bilder erzeugen. Homogenität bezieht sich hierbei sowohl auf visuelle Eigenschaften der Bilder (wir werden geeignete Verfahren zur Extraktion sog. low-level Merkmale sowie Verfahren zum Bildvergleich in der technologischen Einführung zeigen) als auch auf die textuellen Metadaten, die mit Hilfe von Named Entity Mapping (auch dies werden wir in der technischen Einführung näher erläutern) auf semantischen Entitäen abgebildet werden. Ziel ist es dabei, Bildgruppen zu identifizieren, die einen guten Trade-Off zwischen visueller Varianz und Homogenität darstellen.

Einführungsfolien

Die Folien vom gestrigen KickOff sind hier zu finden.

Nochmal als Hinweis: Der nächste Termin findet am 19.4.2013, 9 Uhr statt. Bis dahin könnt ihr Euch in Gruppen zusammen finden und schonmal die Literatur, die in den Materialien zu finden ist, sichten. Darauf aufbauend habt ihr ja vielleicht erste Ideen für die Herangehensweise...

Monday, April 8, 2013

Nächster Termin und Gruppenfindung

Unser nächstes Treffen mit einer technologischen Einführung in die relevanten Bereiche aus Computer Vision, Semantic Analysis und Data Mining findet am

Freitag 19.4.2012, 9 Uhr, Raum A-2.2

statt. Bitte findet euch bis zu diesem Termin in Gruppen zu 2-3 Studenten zusammen. Wir haben euch hierfür bereits ein Doodle angelegt:

Doodle

Thursday, April 4, 2013

Semantic Multimedia

Die automatisierte Erkennung von Bildinhalten stellt eine wichtige Quelle für beschreibende Metadaten dar, damit große Archive erst durchsuchbar werden. Die hierbei eingesetzten Technologien zum Machine Learning benötigen jedoch eine große Anzahl manuell erzeugter Trainingsdaten, um Bilder in Kategorien klassifizieren zu können.

Online Photo-Communities, wie Flickr, stellen eine wertvolle Quelle für manuell verschlagwortete Bilddaten dar. Die Qualität der Schlagworte variiert jedoch stark und ist zudem abhängig von der Intention des jeweiligen Autors.

Im Rahmen des Seminars Semantic Multimedia sollen Verfahren aus den Bereichen Computer Vision, Semantic Analysis und Data Mining kombiniert werden, um Bilder mit hohem semantischen Bezug zwischen Annotationen und dargestelltem Bildinhalt zu identifizieren.

Seminarthemen

  • Automatisierte Topic Detection in Flickr Daten durch Extraktion visueller und semantischer Metadaten
  • Extraktion relevanter visueller Bildmerkmale (Feature Extraction)
  • Abbilden von textuellen Annotation auf semantische Metadaten (Named Entity Mapping)
  • Data Mining

Allgemeine Informationen


Erste Veranstaltung: 

Montag, 8. April, 11:00 Uhr


Leistungserfassung

  • Umsetzung einer vorgegebenen Implementierungsaufgabe
  • Präsentation der Ergebnisse
  • Schriftliche Ausarbeitung zum Vortragsthema