pdf ocr スタート ガイド - xlsoft corporation...pdf ocr スタート ガイド 4 はじめに...

17
PDF OCR スタート ガイド 1 スタートガイド エクセルソフト株式会社

Upload: others

Post on 20-Feb-2020

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PDF OCR スタート ガイド - XLsoft Corporation...PDF OCR スタート ガイド 4 はじめに 概要 ドキュメントを即座に PDF に変換、OCR 変換ツール ORPALIS

PDF OCR スタート ガイド

1

スタートガイド

エクセルソフト株式会社

Page 2: PDF OCR スタート ガイド - XLsoft Corporation...PDF OCR スタート ガイド 4 はじめに 概要 ドキュメントを即座に PDF に変換、OCR 変換ツール ORPALIS

PDF OCR スタート ガイド

2

© Copyright 2013-2017 ORPALIS. All rights reserved.

Version 1.1.18 (2018.5.10)

Written by XLsoft Corporation

Page 3: PDF OCR スタート ガイド - XLsoft Corporation...PDF OCR スタート ガイド 4 はじめに 概要 ドキュメントを即座に PDF に変換、OCR 変換ツール ORPALIS

PDF OCR スタート ガイド

3

目次

はじめに ......................................................................................... 4

概要 ..................................................................................................................................... 4

ダウンロード ................................................................................. 5

評価版のインストールとアクティベート ............................................... 6

ライセンス登録 ................................................................................. 8

評価ライセンス ....................................................................................................................... 8

商用ライセンスのアクティベート .................................................................................................. 8

PDF OCR 製品の実行 ..................................................................... 9

検索可能な PDF ファイルを生成 ............................................................................................. 9

サポートするファイル形式 .................................................................... 13

サポートするドキュメント形式 .................................................................................................. 13

サポートする圧縮形式 .......................................................................................................... 15

サポートする言語 ............................................................................ 16

テクニカル サポート .......................................................................... 17

FAQ ................................................................................................................................... 17

お問合せ ............................................................................................................................. 17

Page 4: PDF OCR スタート ガイド - XLsoft Corporation...PDF OCR スタート ガイド 4 はじめに 概要 ドキュメントを即座に PDF に変換、OCR 変換ツール ORPALIS

PDF OCR スタート ガイド

4

はじめに

概要

ドキュメントを即座に PDF に変換、OCR 変換ツール

ORPALIS PDF OCR は、OCR およびレイアウト解析を使用し、とてもシンプルかつ生産性の高い方法

でどのようなドキュメントも検索可能な PDF へ変換します。

Page 5: PDF OCR スタート ガイド - XLsoft Corporation...PDF OCR スタート ガイド 4 はじめに 概要 ドキュメントを即座に PDF に変換、OCR 変換ツール ORPALIS

PDF OCR スタート ガイド

5

ダウンロード

最新の PDF OCR のインストールファイルは、下記のサイトからお申し込みできます:

https://www.xlsoft.com/jp/products/orpalis/download.html

1. PDF OCR には、クラウド版とオンプレミス版(デスクトップまたはサーバー)がありますので、ダウンロードする

際に、エディションを選択します。

オンプレミス版(デスクトップまたサーバー)を使用する場合は、Web のダウンロード ページで、エディションの

選択項目から、[PDF OCR On-Premises] を選択します。

インストール ファイルは、zip ファイルまたは実行可能インストーラーとして提供されます。

Page 6: PDF OCR スタート ガイド - XLsoft Corporation...PDF OCR スタート ガイド 4 はじめに 概要 ドキュメントを即座に PDF に変換、OCR 変換ツール ORPALIS

PDF OCR スタート ガイド

6

評価版のインストールとアクティベート

1. インストール ファイルを実行します。

2. インストールウィザードに従ってインストールを進めてください。

3. [Finish] ボタンをクリックして、インストールを完了します。

Page 7: PDF OCR スタート ガイド - XLsoft Corporation...PDF OCR スタート ガイド 4 はじめに 概要 ドキュメントを即座に PDF に変換、OCR 変換ツール ORPALIS

PDF OCR スタート ガイド

7

4. [ORPALIS PDF OCR Pro. Registration] ダイアログが表示されます。

評価版として、利用する場合は、[License KEY] を空欄のままにして、[Evaluate] ボタンをクリックし

ます。

製品を購入して、License KEY を受け取っている場合は、この画面で License KEY を入力して、

[Register!] ボタンをクリックすることで、ユーザーの登録ができます。

評価版の場合、次のようなダイアログが表示されます。

お名前(英語表記)と Email アドレスを入力して、[Submit] ボタンをクリックします。

注意:

登録には、インターネット接続が必要です。

インターネット接続ができない場合は、弊社までご連絡いただければ、オフラインでのアクティベートするための評

価用ライセンスキーを開発元に申請します。下記の弊社 Web のお問合せフォームからご連絡ください。

http://www.xlsoft.com/jp/services/xlsoft_form.html

会社名、氏名(英語表記)、email アドレスを必ずご記入ください。

5. 評価版であることが表示されます。

OK をクリックして、評価版の登録を完了します。

Page 8: PDF OCR スタート ガイド - XLsoft Corporation...PDF OCR スタート ガイド 4 はじめに 概要 ドキュメントを即座に PDF に変換、OCR 変換ツール ORPALIS

PDF OCR スタート ガイド

8

ライセンス登録

評価ライセンス 前述の評価版のインストールの章をご参照ください。

商用ライセンスのアクティベート

製品を購入すると、正規のライセンスキーを受け取ります。

最新の PDF OCR をインストールして、Registration ダイアログで License KEY を入力して、

[Register!] ボタンをクリックすることで、ユーザーの登録ができます。

Page 9: PDF OCR スタート ガイド - XLsoft Corporation...PDF OCR スタート ガイド 4 はじめに 概要 ドキュメントを即座に PDF に変換、OCR 変換ツール ORPALIS

PDF OCR スタート ガイド

9

PDF OCR 製品の実行

検索可能な PDF ファイルを生成

PDF OCR を使用すると、スキャナーで生成された画像ファイルを OCR 認識して、テキストが検索可能

な PDF ファイルを生成することができます。

画像ファイルを PDF OCR に変換するには:

1. PDF OCR を起動します。

Page 10: PDF OCR スタート ガイド - XLsoft Corporation...PDF OCR スタート ガイド 4 はじめに 概要 ドキュメントを即座に PDF に変換、OCR 変換ツール ORPALIS

PDF OCR スタート ガイド

10

2. [Source] に OCR 認識する画像ファイルを指定します。 [Destination] に出力先のフォルダを

指定します。 この例では、英語のテキストをスキャンした画像 (.PNG ファイル)を読み込みます。

3. 変換処理で同時に実行したいスレッド数を [Threads] ドロップダウンで選択します。

4. ソースファイルに対する OCR 言語を [OCR Language] ドロップダウンで選択します。

5. [Start] ボタンをクリックすると、OCR 認識および PDF への変換処理が開始されます。

6. 変換が完了すると、結果がダイアログの下部に表示されます。

Page 11: PDF OCR スタート ガイド - XLsoft Corporation...PDF OCR スタート ガイド 4 はじめに 概要 ドキュメントを即座に PDF に変換、OCR 変換ツール ORPALIS

PDF OCR スタート ガイド

11

変換された PDF ファイルを Acrobat Reader などの PDF ビューアで表示して、テキストが検索できる

ことを確認してください。

この例では、”desktop” という単語を PDF から検索すると、その場所がハイライト表示されています。

評価版の場合、PDF OCR の透かし(ウォーターマーク)が生成された PDF に追加されます。

Page 12: PDF OCR スタート ガイド - XLsoft Corporation...PDF OCR スタート ガイド 4 はじめに 概要 ドキュメントを即座に PDF に変換、OCR 変換ツール ORPALIS

PDF OCR スタート ガイド

12

次の日本語のテキストのサンプルでは、”記録方法” という単語を PDF から検索すると、その場所がハイ

ライト表示されています。

Page 13: PDF OCR スタート ガイド - XLsoft Corporation...PDF OCR スタート ガイド 4 はじめに 概要 ドキュメントを即座に PDF に変換、OCR 変換ツール ORPALIS

PDF OCR スタート ガイド

13

サポートするファイル形式

サポートするドキュメント形式 SVG SVG – Scalable Vector Graphics

PDF PDF – Portable Document Format

PDF/A – Document Format for long term preservation

PDF Multi-page – Portable Document Format

Metafile EMF – Enhanced Windows Metaformat

WMF – Standard Windows Metaformat

ラスター画像

WSQ – Wavelet scalar quantization

ANIMATED GIF – Graphics

Interchange Format

BMP – Standard Windows Bitmap

Format

CUT – Dr. Halo/Dr.Genius

Clipboard Format

DDS – Microsoft DirectDraw

Surface Format

DIB – Standard Windows Bitmap

Format

DICOM – Digital Imaging and

Communications in Medicine

EXIF – Exchangeable Image

Format

EXR – OpenEXR Format

FAX, G3 – Group 3 Raw Fax

Format

GIF, Interlaced GIF – Graphics

Interchange Format

PBM – Portable Bitmap File

PBM RAW – Portable Bitmap

BINARY

PCD – Kodak Photo-CD file

PCT, PICT, PIC – Macintosh PICT

Format

PCX – PC Paintbrush Format

PFM – Portable Float Map

PGM – Portable Graymap File

PGM RAW – Portable Graymap

BINARY

PSD – Photoshop File

PNG – Portable Network Graphics

Format

PNM – Portable Any Map

PPM – Portable Pixmap File

PPM RAW – Portable Pixmap

BINARY

RAS – Sun Raster Format

RAW camera image

Page 14: PDF OCR スタート ガイド - XLsoft Corporation...PDF OCR スタート ガイド 4 はじめに 概要 ドキュメントを即座に PDF に変換、OCR 変換ツール ORPALIS

PDF OCR スタート ガイド

14

HDR – High Dynamic Range

Format

IFF – Interchange Format

ICO (single page and multi page)

– Icone Format

J2K, J2C – JPEG-2000 Codestream

JB2, JBIG2 – Joint Bi-level Image

Experts Group

JIF, JFIF – JPEG File Interchange

Format

JNG – JPEG Network Graphics

JP2 – JPEG-2000 Format

JPEG, JPG, JPE – Joint

Photographic Expert Group

JPEG progressive

KOA – KOALA Format

LBM – Interchange File Format-

Interleaved Bitmap

MNG – Multiple-image Network

Graphics *

RAW memory bits – RAW bitmap

RLE – Standard Windows Bitmap

format

SGI – Silicon Graphics Image

Format

TGA, TARGA – TARGA Image

Format

TIFF, TIF – Tagged Image Format

TIFF Multi-page – Multi-page

Tagged Image Format

WBMP, WAP, WBM – Wireless

Bitmap

XBM – X-Bitmap Format

XPM – X Pixmap Format

Page 15: PDF OCR スタート ガイド - XLsoft Corporation...PDF OCR スタート ガイド 4 はじめに 概要 ドキュメントを即座に PDF に変換、OCR 変換ツール ORPALIS

PDF OCR スタート ガイド

15

サポートする圧縮形式

JPEG – Joint Photographic Experts Group.

OJPEG (Old JPEG 6.0 compression).

JPEG 2000 – JPEG wavelet-based image compression.

JBIG2 – Joint Bi-level Image Experts Group.

Packbits – lossless compression scheme for run-length encoding of data.

CCITT Group 3 Fax coding.

CCITT Group 4 Fax coding.

Modified Huffman coding.

RLE – Run-length encoding.

LZW – Lempel-Ziv-Welch

LogLuv – for high dynamic range imaging data.

Deflate

Huffman

Arithmetic coding

WebP

Page 16: PDF OCR スタート ガイド - XLsoft Corporation...PDF OCR スタート ガイド 4 はじめに 概要 ドキュメントを即座に PDF に変換、OCR 変換ツール ORPALIS

PDF OCR スタート ガイド

16

サポートする言語

Arabic

Bulgarian

Catalan

Czech

Chinese (Simplified)

Chinese (Traditional)

Cherokee

Danish

Danish (Fraktur)

German

Old German (Fraktur)

Greek

English

Finnish

French

Hebrew

Hindi

Hungarian

Indonesian

Italian

Japanese (日本語)

Korean

Latvian

Lithuanian

Dutch

Norwegian

Polish

Portuguese

Romanian

Russian

Slovakian

Slovakian (Fraktur)

Slovenian

Spanish

Serbian (Latin)

Swedish

Swedish (Fraktur)

Tagalog

Thai

Turkish

Ukrainian

Vietnamese

無料のクラウド版は、English, French, Spanish, German および Italian をサポート

します。

Page 17: PDF OCR スタート ガイド - XLsoft Corporation...PDF OCR スタート ガイド 4 はじめに 概要 ドキュメントを即座に PDF に変換、OCR 変換ツール ORPALIS

PDF OCR スタート ガイド

17

テクニカル サポート

FAQ FAQ については、弊社のサポート ページおよび開発元のサポート ページを参照してください。

エクセルソフト株式会社の Web

https://www.xlsoft.com/jp/products/orpalis/pdfocr.html

開発元 (ORPALIS) の Web

http://pdfocr.orpalis.com/faq/

お問合せ エクセルソフト株式会社ではテクニカル サポートを下記のお問い合わせ窓口より承っております。

https://www.xlsoft.com/jp/services/xlsoft_form.html

エクセルソフト株式会社

〒108-0073 東京都港区三田 3-9-9 森伝ビル 6F

https://www.xlsoft.com

E-Mail : [email protected]