Diplomarbeit, Studienarbeit für Informatik-Studenten
Wir sind eine Internetagentur in der Nähe von Stuttgart und beschäftigen uns hauptsächlich mit Netzauftritten per TYPO3 und Suchmaschinenoptimierung.
Webadressen (URLs) bzw. Domänadressen liegen vor.
Das zu erstellende Programm soll alle Kontakt- und personenbezogenen Daten aus Webseiten extrahieren. Die gewonnenen Daten werden wahlweise in einer Textdatei oder einer Datenbank abgelegt.
Dabei sollen Daten, die z.B. per CSS unsichtbar sind, ausgelassen werden. Es sind alle beliebigen Schreibweisen von Telefonnummern, Namen, Adressen etc. zu berücksichtigen und normiert auszugeben, auch sprachabhängig, z.B. für Deutsch, Englisch und andere Sprachen.
Die Extrahierung und die Bestimmung relevanter Webdressen sind zwei Studienarbeiten, die aber auch von zwei Studenten gemeinsam durchgeführt werden können.
TYPO3-Beratung.com
Eberhardstr. 17
D-72622 Nürtingen
Telefon: (+49) 70 22 / 60 20 05
E-Mail : diplomarbeit(via)typo3-beratung.com
Schlagwörter: DIPLOM-THEMA, Datenextraktion, Datenspionage, Internetspionage, Bots, Diplomthema, Informatik, Mathematik, Extrahieren von Kontaktdaten und personenbezogenen Daten aus Webseiten.