Wir sind eine Internetagentur aus Nürtingen (östlich von Stuttgart). Wir beschäftigen uns vorwiegend mit TYPO3-Homepages sowie mit Suchmaschinenoptimierung.
Schlagwörter und Domännamen sind vorgegeben bzw. werden eingegeben.
Das zu erstellende Programm soll alle Webseiten einer Domäne prüfen, ob zu den Schlagwörtern passende Webseiten vorhanden sind und diese ähnlich den Suchmaschinen gewichten (Meta-Informationen, Schlagworthäufigkeit usw.).
Späteres Ziel (kein Gegenstand dieser Tätigkeit) ist, Kontaktdaten oder andere Daten von den Webseiten einer Domäne zu extrahieren, die zum Thema der Suchanfrage passen.
Einstellbar soll sein, ob genau die Suchbegriffe vorhanden sein müssen oder ob alternative Begriffe relevant sind. Zur Verknüpfung der Suchbegriffe sind UND-, ODER- und NICHT-Operatoren sowie Klammerungen möglich (max. 10 Therme).
Es ist also die Relevanz einer Webseite zu bestimmen, die sich aus der Entfernung einer Webseite mit den gesuchten Daten zur nächsten Themenwebseite ergibt. Die eigentliche Herausforderung ist das Entwickeln von Algorithmen zum Bestimmen der Relevanz entfernter Webseiten, ohne dass die Schlagwörter dort enthalten sein müssen.
Die bewerteten Webseiten werden entweder in einer Datenbank oder sequentiell in einer Datei gespeichert, um diese im Rahmen einer weiteren Studienarbeit entsprechend zu extrahieren.
Die Relevanzbestimmung und die Extrahierung sind zwei Studienarbeiten, die aber auch von zwei Studenten gemeinsam durchgeführt werden können.
TYPO3-Beratung.com
Eberhardstr. 17
D-72622 Nürtingen
Telefon: (+49) 70 22 / 60 20 05
E-Mail : diplomarbeit(at)typo3-beratung.com
Schlagwörter: DIPLOM-THEMA, Webseitenrelevanz, Themenrelevanz, Schlagworthäufigkeit, Keywordrate, Diplomthema, Informatik, Mathematik, Relevanz einer Webseite hinsichtlich Sprache und Thema einer Netzauftritts bzw. Relevanzfaktor zu anderen Webseiten dieser Domäne.