🧩 AI OSS Timelineに新しいOSSを登録しました
🧩 AI OSS Timelineに新しいOSSを登録しました
A toolkit for converting PDFs and other image-based document formats into clean, readable, plain text format.
PDFや画像ドキュメントからクリーンなテキストへの変換を行うツールキットです。表組みや数式といった複雑なフォーマット構造も保持しながら、自然な読み取り順で高精度にテキストを抽出できます。
#olmocr #AI #OSS #GitHub
https://github.com/allenai/olmocr
詳細:
https://aiknowledgecms.exbridge.jp/oss.php
A toolkit for converting PDFs and other image-based document formats into clean, readable, plain text format.
PDFや画像ドキュメントからクリーンなテキストへの変換を行うツールキットです。表組みや数式といった複雑なフォーマット構造も保持しながら、自然な読み取り順で高精度にテキストを抽出できます。
#olmocr #AI #OSS #GitHub
https://github.com/allenai/olmocr
詳細:
https://aiknowledgecms.exbridge.jp/oss.php