Inhaltsverzeichnis

23.12.4 Klasse Pdf

Die Klasse Pdf (gb.poppler) ist statisch und stellt 4 numerische Konstanten in Bezug auf die Suche in einem PDF-Dokument mit der Methode hPdfDocument.Find(argSuchtext, [ argSuchOption ]) bereit:

KonstanteWertBeschreibung
CaseSensitive1Groß- und Kleinschreibung beachten
Backwards2Rückwärtssuche
WholeWordsOnly4Nur nach ganzen Wörtern suchen
IgnoreDiacritics8Diakritische Zeichen ignorieren

Tabelle 23.12.4.1 : Konstanten der Klasse Pdf

23.12.4.1 Beispiel

Mit dem folgenden Quelltext kann in einer PDF-Datei nach einem bestimmten Text gesucht werden. In der Konsole der IDE werden die Koordinaten des text-umschließenden Rechtecks ausgegeben:

Public Sub SearchText(sSearchText As String, Optional iSearchOption As Integer)
 
  Dim i As Integer
  Dim aRectF As New RectF[]
 
  If IsNull(iSearchOption) Then iSearchOption = 0
 
  For i = 0 To $hPdfDocument.Max
      aRectF = $hPdfDocument[i].FindText(sSearchText, iSearchOption)
      If aRectF.Count > 0 Then
         For Each hRectF As RectF In aRectF
             Print "x: "; Round(hRectF.X, -1); "  y: "; Round(hRectF.Y, -1);
             Print "  |  w: "; Round(hRectF.W, -1); "  h: "; Round(hRectF.H, -1)
         Next
      Endif
  Next
 
End

Dieser Text befindet sich in der Datei simpletext.pdf:

Er programmiert in der Programmiersprache Gambas.
Fazit: Gambas ist toll!

Der Aufruf der Prozedur mit dem Suchtext „Gambas“ und zwei Suchoptionen:

SearchText("Gambas", Pdf.CaseSensitive Or Pdf.WholeWordsOnly)

ergibt diese Anzeige in der Konsole:

Rechteck-Koordinaten:
----------------------------------------
x: 66,6  y: 736,3  |  w: 52,9  h: 15,6

Download