Die Klasse Pdf (gb.poppler) ist statisch und stellt 4 numerische Konstanten in Bezug auf die Suche in einem PDF-Dokument mit der Methode hPdfDocument.Find(argSuchtext, [ argSuchOption ]) bereit:
Konstante | Wert | Beschreibung |
---|---|---|
CaseSensitive | 1 | Groß- und Kleinschreibung beachten |
Backwards | 2 | Rückwärtssuche |
WholeWordsOnly | 4 | Nur nach ganzen Wörtern suchen |
IgnoreDiacritics | 8 | Diakritische Zeichen ignorieren |
Tabelle 23.12.4.1 : Konstanten der Klasse Pdf
Mit dem folgenden Quelltext kann in einer PDF-Datei nach einem bestimmten Text gesucht werden. In der Konsole der IDE werden die Koordinaten des text-umschließenden Rechtecks ausgegeben:
Public Sub SearchText(sSearchText As String, Optional iSearchOption As Integer) Dim i As Integer Dim aRectF As New RectF[] If IsNull(iSearchOption) Then iSearchOption = 0 For i = 0 To $hPdfDocument.Max aRectF = $hPdfDocument[i].FindText(sSearchText, iSearchOption) If aRectF.Count > 0 Then For Each hRectF As RectF In aRectF Print "x: "; Round(hRectF.X, -1); " y: "; Round(hRectF.Y, -1); Print " | w: "; Round(hRectF.W, -1); " h: "; Round(hRectF.H, -1) Next Endif Next End
Dieser Text befindet sich in der Datei simpletext.pdf:
Er programmiert in der Programmiersprache Gambas. Fazit: Gambas ist toll!
Der Aufruf der Prozedur mit dem Suchtext „Gambas“ und zwei Suchoptionen:
SearchText("Gambas", Pdf.CaseSensitive Or Pdf.WholeWordsOnly)
ergibt diese Anzeige in der Konsole:
Rechteck-Koordinaten: ---------------------------------------- x: 66,6 y: 736,3 | w: 52,9 h: 15,6
Artikel