2014-10-25から1日間の記事一覧

PDFBoxで取得したテキストの空白置換

SlideShareがやっているように、PDFスライドから抽出したしたテキストから、改行やタブを半角スペース1つに置換を試みた際にはまったのでメモ。取得したいのはSlideShareのページ下部に表示されているこの文字列。 1. PDFBoxでテキスト抽出 PDFTextStripper.…