DUICUO

モデルサイズはたったの17MB!この超軽量な中国語OCRオープンソースプロジェクトは、GitHubで人気を博しています。

プロジェクトアドレス: https://github.com/ouyanghuiyu/chineseocr_lite

光学式文字認識(OCR)は、ほとんどの人にとって馴染みのある概念です。これは、電子機器(スキャナやデジタルカメラなど)が紙に印刷された文字を読み取り、明暗のパターンを検出することで文字の形状を判別し、文字認識手法を用いてその形状をコンピュータテキストに変換するプロセスを指します。

現在、最もよく使われているオープンソースの中国語OCRプロジェクトはchineseocrです。最近、新たなオープンソースの中国語OCRプロジェクトが登場し、GitHubのトレンドリストで2位にランクインしました。chineseocr_liteです。

これは、縦書きテキスト認識とNCNN推論をサポートする超軽量の中国語OCRツールです。モデルサイズはわずか17MBで、PSenet(8.5MB)、CRNN(6.3MB)、AngleNet(1.5MB)で構成されています。現在、GitHubでは2.6Kのスターと343のフォークを獲得しています(GitHubアドレス:https://github.com/ouyanghuiyu/chineseocr_lite)。

chineseocr_lite によって実装される機能は次のとおりです。

  • 軽量のバックワン検出モデル psenet (8.5M)、crnn_lstm_lite (9.5M)、行テキスト方向分類ネットワーク (1.5M) を提供します。
  • 任意の方向のテキストを検出し、認識中にテキスト行の方向を決定します。
  • crnncrnn_lite lstmdense 認識 (ocr-dense と ocr-lstm は Chineseocr から移植されています)
  • 縦書きテキスト認識をサポート
  • ncnn実装(LSTMをサポート)
  • mnn実装

早速、結果を見てみましょう。

次に、chineseocr_lite のランタイム環境について説明します。

  • ウブントゥ 18.04
  • Python 3.6.9
  • PyTorch 1.5.0.dev20200227+CPU

さらに、プロジェクト作成者は最近、利用可能な機能を更新しました。

  • NihuiによるCRNN_LSTM推論の実装
  • 精度を高めるために、crnn_lite_lstm_dw.pth モデルを crnn_lite_lstm_dw_v2.pth にアップグレードします。
  • 縦書きテキストのサンプルとフォント ライブラリ (フォントは 90 度回転) を提供します。

このプロジェクトに興味がある方は、ぜひお試しください。