2026-06-14
画像から文字を抜き出す(OCR)方法とコツ【スクショ文字起こし】
紙の資料を撮った写真、スクリーンショット、画像内に焼き込まれた文字——「この文字をコピーできたら楽なのに」と思ったことはありませんか。OCR(光学文字認識)を使えば、画像の中の文字を読み取って編集可能なテキストに変換できます。この記事では OCR の仕組み、認識精度を上げる撮り方・前処理のコツ、そして無料・ブラウザだけで使える方法を紹介します。
OCR とは何か
OCR(Optical Character Recognition=光学文字認識)は、画像として保存されている文字を解析し、コンピューターが扱えるテキストデータに変換する技術です。スキャンした書類、看板の写真、スクリーンショットなど、「文字が画像になってしまっている」素材を、検索・コピー・編集できる形に戻せます。
近年のブラウザ向け OCR エンジンは日本語と英語を同時に認識でき、単語ごとの位置や信頼度も取得できます。これにより、画像の一部だけを選んで読み取る部分認識なども可能になっています。
こんな場面で役立つ
OCR は日常のさまざまな場面で時間を節約してくれます。
- 紙の資料や名刺をスマホで撮って、その内容をテキスト化する
- スクリーンショットの中の文章をコピーして引用・転記する
- コピー禁止の PDF や画像化された文書から必要な箇所を抜き出す
- 外国語の看板・メニューを撮影してテキスト化し、翻訳ツールに渡す
認識精度を上げる撮り方のコツ
OCR の精度は、元画像の質に大きく左右されます。次のポイントを意識するだけで、誤認識をかなり減らせます。
とくに重要なのは「文字がはっきり大きく写っていること」と「傾きがないこと」です。スマホで撮るときは真上から、影が入らないように撮影しましょう。
- 明るく均一な照明で撮る(影や反射を避ける)
- 文字が傾かないよう、できるだけ正面・真上から撮る
- ピントを合わせ、文字が小さすぎないよう寄って撮る
- 背景の模様やノイズが少ないシンプルな状態にする
ブラウザだけで OCR する手順
無料ツール Redactopix は、画像をサーバに送らずブラウザ内で OCR を実行します。日本語・英語に対応し、プレビュー上をドラッグして範囲を囲めば、その部分だけを読み取る部分認識もできます。
手順は次のとおりです。
- Redactopix を開き、文字を読み取りたい画像を選択する
- 画像全体を読むか、ドラッグで範囲を囲って一部だけ読むかを選ぶ
- ノイズフィルタの強度(off / 緩い / 標準 / 厳しい)を必要に応じて切り替える
- 読み取った結果をコピー、または .txt として書き出す
精度が出ないときの対処
結果に誤字が多い場合は、まず元画像を見直します。文字が小さい・暗い・傾いているなら、撮り直すかトリミングして文字部分を大きくするだけで改善することが多いです。
それでも背景ノイズが多い画像では、ノイズフィルタの強度を上げると効果があります。逆に、薄い文字やかすれた文字はフィルタを強くしすぎると消えてしまうことがあるので、強度を変えながら最適な設定を探すのがコツです。読み取り後は人の目で軽く校正すると確実です。
この記事で紹介したツールを、今すぐ無料で試せます。
Redactopix を使うよくある質問
- Q. 手書きの文字も認識できますか?
- A. OCR エンジンは活字(印刷された文字)の認識に最適化されています。きれいな手書きならある程度読めることもありますが、崩した手書きは精度が大きく落ちます。手書きメモは活字より誤認識が増える前提で、結果を校正してください。
- Q. 日本語と英語が混ざった画像でも大丈夫ですか?
- A. Redactopix は日本語(jpn)と英語(eng)を同時に認識する設定で動くため、和英混在の画像にも対応できます。ただし混在が複雑な場合は、範囲を分けて部分認識すると精度が安定します。
- Q. 画像はアップロードされますか?
- A. いいえ。Redactopix は WASM ベースの OCR エンジンをブラウザ内で実行するため、画像はサーバに送信されません。機密性の高い書類のスクショでも安心して使えます(初回のみエンジンと言語データを CDN から取得します)。