
文章校正 / 校閲システムの精度向上PoC
凸版印刷株式会社
目的
チューニング工数削減のために、汎用性のある事前学習済みモデルのBERTを用いて、助詞誤りと同音語の誤変換における修正精度向上及び性能評価を行う
課題
凸版印刷様が開発する文章校正 / 校閲システムの「review-it!」というサービスでは、助詞誤りと同音語の誤変換を修正する機能を持っているが、既存モデルでは各クライアントのチューニングにより精度を担保していたため、モデル管理に工数がかかっていた
効果
既存モデルから事前学習済みモデルのBERTに入れ替えを行ったことで、一部機能の修正精度の向上ならびに推論速度の改善ができた
▼既存モデルとDistilBERTモデルの比較結果
助詞抜け校正エンジンの修正精度以外においては精度ならびに速度の改善が確認できた
ー お話を伺った方
凸版印刷株式会社 ご担当者様
プロジェクト発足時:自社ツールの学習コストを下げつつモデル精度を高めたい
弊社で自社開発した文章構成及び校閲サービス(review-it!)で、当時活用していたモデルの誤用助詞の検出及び修正案サジェストと、誤変換の検出及び修正案サジェストの精度を向上させる必要がありました。学習コストを下げてモデルの向上を行いたい、かつ転移学習ができるように作り直したいという経緯からプロジェクトの発足に至りました。
情報が出し切れない中でもプロジェクトを柔軟に進められた
弊社の工数的に社内だけでのプロジェクトとして進めることが難しかったため、今回レッジ様に依頼をさせていただきました。情報セキュリティの観点から弊社側で情報を出しきれない部分があったので、システムの組み込みに苦労した部分もあったかと思いますが、プロジェクトの課題感等を確認しつつ柔軟に進めていただけたと思っております。
目標だったモデルの精度向上と速度改善を達成
弊社側の情報セキュリティの都合もあり、全ての目的を達成することは見送りとなりましたが、結果として、プロジェクトの目標の1つであったモデルの精度向上は達成できました。既存モデルからDistilBERTの事前学習済みモデルに入れ替えを行ったことで、一部機能(助詞抜け校正エンジンの修正精度以外)においては精度並びに速度の改善が確認できたので、この点がプロジェクトの成果として挙げられたのかなと思っております。
改善を経て、他業界への展開を目指す
2022年3月にリリースした「review-it! for Package」というオンライン校正および回覧、AI文章チェックを可能とした業務効率化のサービスを、さまざまな業界に展開していければ良いなと思っております。現在、金融業界向けのみとなっているので、その他の業界にも使っていただけるように既存モデルをアップデートするような形で機能面を拡充していければと思います。
トッパンは、「印刷テクノロジー」をベースに「情報コミュニケーション事業分野」、「生活・産業事業分野」および「エレクトロニクス事業分野」の3分野にわたり幅広い事業活動を展開しております。