「あの企業の営業利益率は?」と生成AIに尋ねた時に返ってきた数字が全くのでたらめだったという経験はないだろうか。
AIがもっともらしい嘘をつく「ハルシネーション」は、AI自身の性能不足だけが原因ではない。多くの場合、AIが情報を拾ってくる元のWebサイトが「人間が見るため」に作られており、機械にとって読み取りにくい構造になっていることが要因だ。
AIを真のビジネスパートナーとして活用するためには、人間向けの画面ではなく、機械が直接読み込んで理解できる「データ基盤」を整える必要がある。この課題にいち早く応え、日本の財務データをAI向けに再構築した新しいプラットフォームが注目を集めている。(文=AI Base編集部)
2026年3月1日、AIエージェント基盤の開発などを手掛けるCabocia株式会社は、AIから直接つながる日本株の有報データ基盤「EDINET DB」を正式にリリースした。
(引用元:PR TIMES)
金融庁のシステム「EDINET」には、全上場企業の有価証券報告書が公開されており、無料でアクセスできる。しかし、このデータを横断的に分析するのは極めて困難だった。日本基準、米国基準、国際基準といった会計基準の違いによって科目名が異なり、企業ごとに独自のタグ付け(定義)が行われているためだ。AIがこのバラバラな情報をそのまま読み込もうとすれば、当然ながら誤認識やハルシネーションのリスクが高まってしまう。
(引用元:PR TIMES)
Cabociaの「EDINET DB」は、この複雑な差異を吸収する「名寄せ」の処理を自動化し、上場全3,846社を横断して分析できる、構造化されたデータとして提供する。さらに大きな特徴は、ChatGPTやClaudeといったブラウザ上のAIツールから、「MCP」と呼ばれるプロトコルを通じてこのデータベースへ直接接続できる点にある。これにより、AIはWeb検索を経由せずに正確な数値をダイレクトに取得できるようになり、ハルシネーションのリスクが劇的に低下する。
2月17日のβ公開から約10日間で、APIキーの発行数は1,300件を超え、公認会計士や個人投資家などから「手作業の加工が不要になる」「AIで企業の数字が正しく取れない問題が解消される」といった高い評価を集めている。
今回の「EDINET DB」の登場は、インターネット上の情報発信のあり方が、「人間に見せるためのWeb」から「AIに読み込ませるためのデータ構造」へと本格的に移行し始めたことを示している。
これまで企業は、自社の業績やサービス内容を自社サイトやPDFのレポートにまとめ、人間がいかに読みやすいかを重視してデザインしてきた。しかし、情報収集の起点が検索エンジンから生成AIへと急速に移り変わる中、人間向けの美しいレイアウトは、かえってAIにとってノイズとなり、情報の正確な抽出を阻害する要因となっている。
AIを業務に組み込み、高度な分析や自動化を実現するためには、テキストや数値を意味の通った形式で整理し、APIなどを通じて直接機械に渡す「構造化データ」の整備が不可欠となる。企業ごとにバラバラな定義を統一し、AIが迷うことなく情報を拾える状態を作ることこそが、結果として人間にとって最も効率的な業務プロセスの構築につながるのだ。
人間が手作業でデータを集めてAIに学習させるのではなく、AIが整えられたデータベースにアクセスし、正確な答えを導き出す。この新しい情報の流れは、財務分析に限らず、あらゆる産業のバックオフィス業務を劇的に効率化する可能性を秘めている。自社の情報をいかに「AIにとってアクセスしやすい形」に整えるか。この視点を持つ企業こそが、次世代のビジネス環境において圧倒的なスピードと正確性を武器に競争を勝ち抜いていくはずだ。