スタイル・エッジ技術ブログ

士業集客支援/コンサルティングのスタイル・エッジのエンジニアによるブログです。

AWS Summit Japan 2025セッションレポート(Amazon Bedrock で作る未来の開発サイクルとオペレーション戦略)

はじめに

こんにちは!スタイル・エッジでエンジニアをしているせっちゃんです!

この記事は、AWS Summit 2025で参加したセッション「Amazon Bedrock で作る未来の開発サイクルとオペレーション戦略」のレポート記事です!

会場

セッション概要

基本情報

AIを活用したプロダクトの開発などを行う、株式会社LayerXの中川佳希さんによる「Amazon Bedrock で作る未来の開発サイクルとオペレーション戦略」を聞いてきました!

選択理由

弊社では、生成AIを活用しクライアントの皆様への価値提供を全社的に取り組んでおります。
そんな中、Amazon Bedrockを用いたアプリケーションの開発や活用事例に興味があり、最新情報をキャッチアップするために聞いてみたいと思いました。


セッションの詳細内容

1. 活用事例

プロダクトでのAI活用

  • 紙資料の一括処理: 束になった紙資料をスキャンし、意味のあるまとまりに自動分類
  • 領収書の自動処理: 領収書を撮影するだけで、推薦された内容をワンタップで稟議申請完了

特徴

  • 運用に合わせた最適化: 各企業の運用フローに合わせてカスタマイズ
  • パーソナライズ機能: 抽出したいデータに応じて、運用に適したデータを抽出

2. 技術的な実現方法

データセット構築の重要性

帳票内の類似データを細分化し、データセットを作ることが技術の核となっている。

意味理解の実現

多くのデータを抽出(extract)するだけでなく、「誰に、いつ、いくら?」といった意味を理解する必要がある。

推薦モデルの構築

  • 過去の入力履歴を活用: 最適な提案を自動生成
  • 実際の運用に即した値の取得: ビジネスロジックに基づいた提案
    • 例:日曜日が支払い期限の場合、二日前の金曜日を自動指定

3. アノテーション基盤におけるAmazon Bedrockの活用

機械学習モデル構築における課題

自社で機械学習モデルを作成するため、学習と検証用のデータセットが必須となる。帳票から必要な情報(項目)を抽出し、それぞれに正しいラベル(分類)を付与する「アノテーション」作業が発生する。

しかし、帳票の種類も数多く、解釈も複数考えられるため、アノテーション作業は簡単ではない。これが機械学習モデル構築のボトルネックとなっている。

内製システムによる効率化

正確なアノテーションデータ(座標・値)をより効率的に作るため、システムを内製化している。

  • 読み取り項目ごとに座標と値の入力をサポート
  • ユーザーの入力値のサジェスト機能
  • バウンディングボックスで文字の領域を囲む視覚的サポート
  • 作業負荷の軽減

アノテーション項目増加による新たな課題

項目数増により、帳票1枚あたりの作業時間が増加。項目種類が増えることにより、正しいラベルを選ぶ難易度が上がった。新たな種類の項目はスタート時、推論可能なモデルやユーザーの入力値がなく、候補をサジェストできないためアノテーション作業の難易度が上がる。

LLM(大規模言語モデル)の活用

Steps:

  1. 帳票ファイルにOCRを実行、テキスト化
  2. テキスト化されたデータと抽出項目を定義したプロンプトをLLMに与える
  3. アノテーションデータを得る

課題解消効果:

  • 新たな種類のアノテーション項目でもゼロショットで値を推論可能
  • 一時的な正解ラベルとして、アノテーション完了を待たず早期にモデルトレーニングが可能、リードタイムを短縮
  • アノテーションの方法やモデルの選定の方向に問題がないかの検証が行える
  • 求めるアノテーションデータをJSON Schemaで定義し、構造化した出力を指示可能
  • ハルシネーション対策としてJSON Schemaに意味的なバリデーションの仕組みを導入

非構造データから構造データへの変換

文字列の抽出 → LLMによる推論 → 構造データ化という流れで、非構造データから正規化された構造データを得ている。

4. Amazon Bedrockを用いたアノテーションタスク

Amazon Bedrockの特長

  • データ越境なし: Amazon Bedrock(東京)リージョンで処理、海外へのデータ越境がない
  • セキュリティ: LLMモデルプロバイダーのAPIキー発行が不要、IAMでのリソースアクセス制御が行える
  • 最新モデル: 最新のClaudeモデルが利用可能
  • 構造化出力: Claude JSON modeにより出力フォーマットが指定可能、構造化されたアノテーションデータが得られる

フルマネージドなAWS内で完結するアーキテクチャ

処理フロー: 1. 開発者がAWS Step Functionsを起動 2. AWS Fargateタスクを実行 3. Amazon S3からテキストデータを取得 4. Amazon Bedrockでの推論 5. Amazon Auroraに結果を保存

時間短縮とコスト圧縮のインパクト

1,000枚の帳票に対するアノテーションは、わずか1.5時間ほどで完了。人間が行う場合、1,000枚から40項目を抽出するとなるとおおよそ165時間(1日8時間 × 5日間 × 4人分の仕事量)が必要となる。

5. LLM活用の課題と展望

現状の課題

精度面: * 現状では、ユーザーにパーソナライズさせた結果を返す水準に至らない * 自社ドメインのデータで学習した従来の機械学習モデルの方が、精度の面で高いことが多い * リクエスト量が多大で、レイテンシの速さも求められる

技術的制約: * 精度が向上する可能性を持つアプローチが限られている * 誤りの修正が困難、どこからその値を抽出したかや座標位置などの特定ができない * 「帳票内に存在しない値を出力」や「出力スキーマに従っていない」をゼロにできない * LLMモデルプロバイダーによるAPIレートリミットの制限を受ける

今後の展望

LLMが得意なユースケースの活用: * 多言語対応: 日本語以外の帳票での活用。英語以外の外国語帳票のアノテーションは、第一言語にない人では抽出後の意味付けが難しく、暗黙的な慣習も不明(汎用的な言語モデルが活かせる)


セッションを受けての感想

印象に残ったポイント

アノテーション作業の効率化による開発サイクルの加速

従来165時間かかっていた1,000枚の帳票アノテーションが1.5時間に短縮されたという具体的な数値は非常に印象的でした。
機械学習モデルの開発において、データ準備が最大のボトルネックとなっている現状を考えると、この効率化は開発サイクル全体を大きく変革する可能性を秘めていると思います。
また、単なるLLMの紹介ではなく、実際の業務課題(アノテーション作業の効率化)に対して具体的なソリューションとして活用されている点が興味深かったです。

実務への応用アイデア

士業における紙媒体管理のデータ化

士業(弁護士、税理士、司法書士など)では、紙媒体での管理が行われていることが多いです。契約書、申告書、登記簿謄本、裁判書類など、重要な文書が紙ベースで保管されており、これらを効率的にデジタル化・構造化することができれば、大きな価値を提供できるのではと考えております。
Amazon Bedrockを活用することで、手作業によるデータ入力の大幅削減、書類の検索・参照の効率化、クライアントへの迅速な情報提供が実現できると思います。

まとめ

このセッションを通じて、AI技術の実用的な活用により、従来の業務プロセスを大きく変革できる可能性を強く感じました。
特に紙媒体管理の課題は、多くの企業が直面している普遍的な問題であり、AI技術の活用により大きな価値を生み出せる分野だと考えています。
今回学んだことを、少しでもお客様に還元できるよう挑戦をしていきます!

一緒に働く仲間を募集しています!

スタイル・エッジでは一緒に働く仲間を募集中です。
ご興味をお持ちいただけた方は、ぜひ採用サイトもご覧ください!
recruit.styleedge.co.jp