|
||||||||||
PREV CLASS NEXT CLASS | FRAMES NO FRAMES | |||||||||
SUMMARY: NESTED | FIELD | CONSTR | METHOD | DETAIL: FIELD | CONSTR | METHOD |
java.lang.Objectcrawler.Former
public class Former
Constructor Summary | |
---|---|
Former()
|
Method Summary | |
---|---|
static FirmenProfilDTO |
allFromProfile(java.io.InputStream is)
Liest alle Informationen aus einer Hoppenstedtprofilseite aus und schreibt die Datei in ein FirmenProfilDTO-Objekt. |
static FirmenProfilDTO |
allFromProfile(java.lang.String html)
Liest alle Informationen aus einer Hoppenstedtprofilseite aus und schreibt die Datei in ein FirmenProfilDTO-Objekt. |
static java.lang.String |
ausgabe(java.lang.String html,
java.lang.String regex)
Finden mit regulären Ausdruck |
static java.lang.String |
ausgabe(java.lang.String data,
java.lang.String startTXT,
java.lang.String endTXT)
Liest einen String data ein und gibt den Substring zwischen startTXT und endTXT zurück |
static java.lang.String[] |
getProfilLinks(java.lang.String html)
Liest den HTML als String ein und gibt ein String-Array mit allen Firmen-Profil-Links zurück |
static java.lang.String |
getSessionID(java.lang.String html)
Liest String mit der Start-Seite von Hoppenstedt ein und gibt die SessionID als String zurück |
static java.lang.String |
killHTMLTags(java.lang.String html)
Löscht HTML-Tags und ungewünschten HTML-Code aus einem String bzw ändert diesen Beispiel: ü wird zu 'ü' |
static java.lang.String[] |
multiAusgabe(java.lang.String html,
java.lang.String regex,
java.lang.String trennung,
java.lang.String replaceTXT)
Gibt bei nicht-atomaren Spalten die Mehrfacheinträge als String-Array zurück |
Methods inherited from class java.lang.Object |
---|
equals, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait |
Constructor Detail |
---|
public Former()
Method Detail |
---|
public static java.lang.String[] getProfilLinks(java.lang.String html)
html
- - String
public static java.lang.String getSessionID(java.lang.String html)
String
- html
public static java.lang.String ausgabe(java.lang.String html, java.lang.String regex)
html
- regex
-
public static java.lang.String ausgabe(java.lang.String data, java.lang.String startTXT, java.lang.String endTXT)
data
- startTXT
- endTXT
-
public static java.lang.String[] multiAusgabe(java.lang.String html, java.lang.String regex, java.lang.String trennung, java.lang.String replaceTXT)
html
- startTXT
- endTXT
- trennung
- replaceTXT
-
public static java.lang.String killHTMLTags(java.lang.String html)
String
- html
public static FirmenProfilDTO allFromProfile(java.lang.String html)
String
- html
public static FirmenProfilDTO allFromProfile(java.io.InputStream is)
InputStream
- is
|
||||||||||
PREV CLASS NEXT CLASS | FRAMES NO FRAMES | |||||||||
SUMMARY: NESTED | FIELD | CONSTR | METHOD | DETAIL: FIELD | CONSTR | METHOD |