Letztes Update:
09.10.2006
- Im neunten Semester 24-wöchiges Praktikum im Institut für Medienkommunikation, Abteilung MARS der Fraunhofer Gesellschaft in Sankt Augustin bei Bonn.
- Aufgabe: ein Testprogramm in der Programmiersprache Java entwickeln, welches das Internetportal netzspannung.org, ein Projekt der MARS-Abteilung, auf Kriterien wie beispielsweise kaputte Links testet.
- netzspannung.org umfasst ca. 500 Seiten, an denen mehrere Personen parallel Veränderungen durchführen.
Um zu vermeiden, dass in dem Webauftritt kaputte Links oder falsch verlinkte Bilder auftreten, soll dieses Testprogramm jede Nacht die Plattform testen. - Verwendung der Technologien HttpClient, Websphinx und Dom4J. HttpClient emuliert einen Browser mit Standard-HTTP-Funktionen; Die Klassenbibliothek von Websphinx hilft, den von HttpClient gelieferten SourceCode einer URL zu Parsen und in eine Baumstruktur zu unterteilen; Dom4J ist ein XML-Framework zum einlesen, bearbeiten und schreiben von XML-Dokumenten.
- Darstellung des Testergebnisses basiert auf XML und XSLT. Die Entwickler erhalten so ein übersichtliches Ergebnis, in welchem Seiten, die einen fehlerhaften Link o.ä. enthalten, sofort zu erkennen sind.
Zusätzlich generiert das Programm eine .csv-Datei, welche in Excel eingelesen werden kann. So kann der Benutzer alle fehlerhaften URLs leicht herausfiltern und gleichzeitig sehen, von welchen URLs diese fehlerhafte URL überall verlinkt wird.