- 2023.03.15
-
- 機械学習/画像処理
医療機関向けKIOSK端末での保険証読取機能開発
当社の主力商品である自動精算機や再来受付機といった既存製品に、顔認証やAI・ロボットといった最先端技術を融合させていくための研究開発を行っているAIロボティクス開発グループ。今回は医療機関向けKIOSK端末での保険証読取機能の開発を行った瀧川さんにお話を伺いました。
瀧川 聡
R&D本部 開発部 AIロボティクス開発グループ
2016年中途入社。
入社後、IoT機器、コード決済や顔認証などの最先端技術を既存市場に導入するための技術評価や開発を経験。
本プロジェクトではプロジェクトマネージャーを担当
AI-OCRの開発スタート
過去に他社の保険証読取端末を利用して製品化したことがありました。その際は、保険証のデザイン変更に対応するにしても、新しい保険証を読み取り可能にするにしても、アルメックスがイニシアティブをとることができず、非常に多くの工数が必要で、結果としてお客様の要望へ応えるのに時間を要してしまっていました。このままでは自社製品のラインナップとして保険証読み取り機能を提供し続けることが困難な状況だったので、AI-OCRを自社開発するプロジェクトがスタートしました。
正しく認識させるため、試行錯誤の繰返し
まずはAI-OCRの根幹である文字検出と文字認識のモデル作成に着手しました。
文字認識には色々な方法が存在していましたが当時は日本語に対応したものがあまりなく、ひらがな・カタカナ・漢字などすべての文字のデータを用意し、半年ほどかけて認識率が上がるように学習とモデルの検証を繰り返しました。
同じ漢字でも書体によって形が微妙に異なりますので、フォントを変えたりノイズや歪みを付加して実際の使用状況に近づけるなど大量のデータ作成が必要で非常に大変な作業でした。似たような文字は誤認識することが多く、正しく認識できるように調整を繰り返して、他社製品と置き換えても遜色ないと評価できるAI-OCRのモデルを開発しました。
次に保険証読取部分に着手しました。保険証のレイアウトを解析して背景と文字を分離し、どこに何が書かれているのか判別する必要があるのですが、保険証は発行元によってデザインやレイアウトが異なるため、可能な限り多種多様な保険証データを収集し、モデルを構築していきました。
読取精度の向上を目指して
機械学習のプロジェクトではよく問題になる事ですが、現物の保険証のデータは個人情報保護の観点から病院の外に持ち出すことができなかったため、チューニングのためには現場での作業がどうしても必要になってきます。
エンジニアが毎日のように導入先の病院様に通い、読取できない保険証があった場合には問題点を持ち帰ってAIモデルのチューニングをするといったことを3か月程行いました。そして社内では現場での情報を元に代わりとなる疑似的なデータを作成して精度向上を達成しました。
ただ、どうしてもクリアできなかった技術的な課題もありました。漢字の一(いち)と-(マイナス)は形状からは区別がつかず、正確に認識することはできません。技術的な限界はありますので、100%の精度を求めるのではなく、営業部門と連携してオペレーションでカバーできるようにUIなどシステム全体のソフトウェアを改善していくことで最大限にお客様のご要望に応えていくことをミッションと考えています。
新技術を自社製品に活かす
AIロボティクス開発グループでは、新しい技術を自社製品に活かせるよう研究開発をすることがミッションです。
そのためには常にアンテナを張り、勉強会や論文などでいち早く情報をキャッチアップすることが重要だと考えています。AI-OCRのように試行錯誤しながら開発を進めることが多いので非常に大変なこともありますが、その分リリースされた時の達成感はとても大きいです。
この達成感を今後も得られるようチャレンジしていきたいです。