crawler
Class Former

java.lang.Object
  extended by crawler.Former

public class Former
extends java.lang.Object


Constructor Summary
Former()
           
 
Method Summary
static FirmenProfilDTO allFromProfile(java.io.InputStream is)
          Liest alle Informationen aus einer Hoppenstedtprofilseite aus und schreibt die Datei in ein FirmenProfilDTO-Objekt.
static FirmenProfilDTO allFromProfile(java.lang.String html)
          Liest alle Informationen aus einer Hoppenstedtprofilseite aus und schreibt die Datei in ein FirmenProfilDTO-Objekt.
static java.lang.String ausgabe(java.lang.String html, java.lang.String regex)
          Finden mit regulären Ausdruck
static java.lang.String ausgabe(java.lang.String data, java.lang.String startTXT, java.lang.String endTXT)
          Liest einen String data ein und gibt den Substring zwischen startTXT und endTXT zurück
static java.lang.String[] getProfilLinks(java.lang.String html)
          Liest den HTML als String ein und gibt ein String-Array mit allen Firmen-Profil-Links zurück
static java.lang.String getSessionID(java.lang.String html)
          Liest String mit der Start-Seite von Hoppenstedt ein und gibt die SessionID als String zurück
static java.lang.String killHTMLTags(java.lang.String html)
          Löscht HTML-Tags und ungewünschten HTML-Code aus einem String bzw ändert diesen Beispiel: ü wird zu 'ü'
static java.lang.String[] multiAusgabe(java.lang.String html, java.lang.String regex, java.lang.String trennung, java.lang.String replaceTXT)
          Gibt bei nicht-atomaren Spalten die Mehrfacheinträge als String-Array zurück
 
Methods inherited from class java.lang.Object
equals, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
 

Constructor Detail

Former

public Former()
Method Detail

getProfilLinks

public static java.lang.String[] getProfilLinks(java.lang.String html)
Liest den HTML als String ein und gibt ein String-Array mit allen Firmen-Profil-Links zurück

Parameters:
html - - String
Returns:
links - String[]

getSessionID

public static java.lang.String getSessionID(java.lang.String html)
Liest String mit der Start-Seite von Hoppenstedt ein und gibt die SessionID als String zurück

Parameters:
String - html
Returns:
String

ausgabe

public static java.lang.String ausgabe(java.lang.String html,
                                       java.lang.String regex)
Finden mit regulären Ausdruck

Parameters:
html -
regex -
Returns:

ausgabe

public static java.lang.String ausgabe(java.lang.String data,
                                       java.lang.String startTXT,
                                       java.lang.String endTXT)
Liest einen String data ein und gibt den Substring zwischen startTXT und endTXT zurück

Parameters:
data -
startTXT -
endTXT -
Returns:
String

multiAusgabe

public static java.lang.String[] multiAusgabe(java.lang.String html,
                                              java.lang.String regex,
                                              java.lang.String trennung,
                                              java.lang.String replaceTXT)
Gibt bei nicht-atomaren Spalten die Mehrfacheinträge als String-Array zurück

Parameters:
html -
startTXT -
endTXT -
trennung -
replaceTXT -
Returns:
String[]

killHTMLTags

public static java.lang.String killHTMLTags(java.lang.String html)
Löscht HTML-Tags und ungewünschten HTML-Code aus einem String bzw ändert diesen Beispiel: ü wird zu 'ü'

Parameters:
String - html
Returns:
String html modified Daniel Seiler

allFromProfile

public static FirmenProfilDTO allFromProfile(java.lang.String html)
Liest alle Informationen aus einer Hoppenstedtprofilseite aus und schreibt die Datei in ein FirmenProfilDTO-Objekt.

Parameters:
String - html
Returns:
FirmenProfilDTO dto

allFromProfile

public static FirmenProfilDTO allFromProfile(java.io.InputStream is)
Liest alle Informationen aus einer Hoppenstedtprofilseite aus und schreibt die Datei in ein FirmenProfilDTO-Objekt.

Parameters:
InputStream - is
Returns:
FirmenProfilDTO dto