「AIに質問しても、なぜか的外れな回答が返ってくる」「ファイル一覧の表示がもたつく」——クラウドストレージを業務の中心に据える企業ほど、こうした”小さなストレス”を日常的に感じているのではないでしょうか。
実はこれらの不満の根本には、「文書の読み取り精度」と「APIサーバーの処理能力」という2つの技術的課題が潜んでいます。
DirectCloudは2026年3月のアップデートで、この2つの課題に対して根本的な改善を施しました。
本コラムでは、その技術的な背景と、現場の業務にもたらされる具体的な変化をわかりやすく解説します。
本記事のサマリ
-
2つのパーサー「MarkItDown」「Unstructured」を導入したことで、テーブル構造・見出し・脚注などの構造情報が正確に保持され、AIの回答精度が向上した
-
APIサーバーの開発言語を「PHP」から「Go」に移行することで、フォルダ/ファイルの表示速度が最大で約80%短縮したことを確認できた(社内検証)
AIの回答精度を下げる「見えない問題」——文書構造の欠損とは
DirectCloud AIをはじめとする企業向けAIアシスタントの多くは、「RAG(Retrieval-Augmented Generation/検索拡張生成)」と呼ばれる仕組みで回答を生成しています。
RAGとは、「パース」「チャンキング」「エンベディング」「検索」「生成」という一連のフローで成り立つAI回答の仕組みです。
参考:「動くRAG」と「使えるRAG」は違う:企業運用で成果を出す品質と継続性を備えた”高品質RAG基盤”の条件
ここで重要なのは、最終的な回答の品質が、最初のステップである「文書の解析(パース)」の精度に大きく左右されるという点です。どれほど優秀なAIモデルを使っていても、読み込む文書の構造情報が欠落していれば、正確な回答は生成できません。
では、「構造情報の欠落」とは具体的にどのような状態を指すのでしょうか。
たとえば、PDFファイルに埋め込まれた表データを想像してください。人間の目には「行と列で整理された一覧表」として見えるその情報も、従来の文書解析エンジンでは、ただのテキストの羅列として認識されていました。
見出しの階層関係、脚注と本文の紐づけ、表のセル構造——こうした「文書の骨格」ともいえる情報が解析段階で失われてしまうと、AIはチャンク化されたテキストの断片だけを頼りに回答を組み立てることになります。
その結果、「表の中にある数値について質問しても見当違いの回答が返ってくる」「マニュアルの脚注に書かれた重要な補足情報が無視される」「報告書のセクション構造を考慮しない的外れな要約が出力される」といった問題が発生していたのです。
つまり、よい回答は「よい前処理」から生まれる——これがRAG運用における大原則です。
DirectCloud AIの解決策——パーサー刷新で文書理解を根本から強化
DirectCloudの開発チームは、この前処理の課題に正面から取り組み、文書解析エンジン(パーサー)そのものを刷新するという判断を下しました。
部分的な修正ではなく、ファイル形式ごとに最適化された新しいパーサーを採用することで、文書理解の質を根本から変えるというアプローチです。
2026年3月のアップデートで導入されたのは、この後説明する2つのパーサーです。
MarkItDown導入(文書ファイル(docx)対応)
-
① 開発背景・課題
DirectCloud AIがデータチャンクを生成する前の解析段階で、テーブル構造・ヘッダー・脚注などの構造情報が解析されていませんでした。その結果、RAGの精度が一部低下していました。
-
② 改善内容
Pythonのライブラリ「Mammoth」で文書ファイル(docx)をいったんHTMLに変換し、「python-docx」で数式を抽出した後、「markdownify」でMarkdown形式に変換するという処理フローに変更しました。
-
③ メリット
テーブル構造、見出し、脚注に加えて、数式を含む文書も正確に処理できるようになりました。
複雑な表を含む議事録や、脚注が多用された契約書であっても、文書の論理構造がMarkdown記法としてチャンクに正確に反映されるため、AIが構造を理解した上で回答を生成できるようになります。
Unstructured導入(PDFファイル対応)
-
① 開発背景・課題
業務で使われるPDFファイルの多くは、レポートや報告書など、表やグラフを多用した複雑なレイアウトを持っています。
従来の解析では、ページをまたいで記載された表が途中で分断されたり、図のキャプションが本文に混在したりするケースが頻発していました。 -
② 改善内容
PDFファイルの文書に対しては、レイアウト認識に特化したパーサー「Unstructured」を導入しました。
Unstructuredは、PDF内の表・図・段落構造を高精度で抽出する能力に優れており、特にページ境界をまたぐ表にも対応できる、という大きな強みを持っています。 -
③ メリット
Unstructuredの導入により、複雑なレイアウトで構成されていても、文書の構造を維持したまま、PDFファイルから正確にテキストを抽出できるようになりました。
これら2つのパーサーの導入によって、脚注や小見出しなどの構造情報がチャンクに正確に反映されるようになり、検索段階で関連チャンクの活用率が大きく向上しています。
パーサー刷新により、従来の表構造が崩れた状態のテキストから、誤った数値を参照してしまう不具合が改善され、正しく保持された表の行列構造から、DirectCloud AIが各セルの値を正確に読み取り、的確な回答を返せるようになります。
議事録、業務マニュアル、報告書、契約書——文書タイプを問わず、一貫した回答品質を維持できることが、今回のパーサー刷新における最大の成果です。
DirectCloud AIは今後も拡張子の対応範囲を拡大
3月アップデートでは、DirectCloud AIの対応拡張子として「mbox」も追加されました。
DirectCloud AIはメール関連ファイル(eml、msg、mbox)において、すでに他社にない強みを持っていますが、今後はpptxやxlsxなどオフィス系ファイルへの対応も順次進めていきます。
| ファイル形式 | ChatGPT | Claude | Gemini | Copilot | DirectCloud AI |
| ■ PDFファイル | |||||
| PDFファイル(pdf) | 〇 | 〇 | 〇 | 〇 | 〇 |
| ■ 文書ファイル | |||||
| Word文書(docx) | 〇 | 〇 | 〇 | 〇 | 〇 |
| PowerPoint(pptx) | 〇 | 〇 | 〇 | 〇 | 〇※ |
| ■ 表計算ファイル | |||||
| CSVファイル(csv) | 〇 | 〇 | 〇 | 〇 | 〇※ |
| Excel(xlsx) | 〇 | △ | 〇 | 〇 | 〇※ |
| ■ 電子メールファイル | |||||
| Eメール(eml) | × | × | × | 〇 | 〇 |
| Outlookメール(msg) | × | × | × | 〇 | 〇 |
| メールボックス(mbox) | × | × | × | × | 〇 |
| ■ テキストファイル | |||||
| テキスト(txt) | 〇 | 〇 | 〇 | 〇 | 〇 |
| ■ データファイル | |||||
| JSONデータ(json) | 〇 | 〇 | △ | 〇 | 〇 |
| ■ その他 | |||||
| URL(Webページ) | 〇 | 〇 | 〇 | 〇 | 〇※ |
| ファイル形式 | ChatGPT | Claude | Gemini | Copilot | DC AI |
| ■ PDFファイル | |||||
| 〇 | 〇 | 〇 | 〇 | 〇 | |
| ■ 文書ファイル | |||||
| docx | 〇 | 〇 | 〇 | 〇 | 〇 |
| pptx | 〇 | 〇 | 〇 | 〇 | 〇※ |
| ■ 表計算ファイル | |||||
| csv | 〇 | 〇 | 〇 | 〇 | 〇※ |
| xlsx | 〇 | △ | 〇 | 〇 | 〇※ |
| ■ 電子メールファイル | |||||
| eml | × | × | × | 〇 | 〇 |
| msg | × | × | × | 〇 | 〇 |
| mbox | × | × | × | × | 〇 |
| ■ テキスト/データ/その他 | |||||
| txt | 〇 | 〇 | 〇 | 〇 | 〇 |
| json | 〇 | 〇 | △ | 〇 | 〇 |
| URL | 〇 | 〇 | 〇 | 〇 | 〇※ |
【凡例】〇:対応 △:条件付き対応(設定・プランにより利用可) ×:非対応
・Claude:Excelファイルを読み込むには、アカウント設定で「コード実行とファイル作成」機能を有効化する必要があります。
・Gemini:JSONなどのコード/データファイルは、主に有料プランでのサポート対象となり、無料プランでは制限される場合があります。
・ChatGPT・Claude・Gemini:電子メールファイル形式(eml/msg)は各社の公式サポート対象に含まれていません。利用する場合はPDFやテキスト形式に変換する必要があります。
・ChatGPT・Claude・Gemini・Copilot:Thunderbirdなどで利用されるメールボックス形式(mbox)は、いずれのサービスでも公式サポート対象外です。
・DirectCloud AI:pptx、csv、xlsx、URL は、今後のアップデートで順次実装予定です。
「遅さ」の正体——PHPサーバーが抱える並行処理の限界
ここからは、もう1つの改善ポイントであるインフラ面の課題に目を向けてみましょう。
DirectCloudのシステム内部では、フォルダ一覧やファイルリストの表示をはじめとする多くの操作が、APIサーバーへのリクエストによって処理されています。
Webアプリケーション(ブラウザ)でフォルダを開く、モバイルアプリでファイルを検索する、共有リンクを生成する——ユーザーが意識しないところで、これらの操作のたびにAPIサーバーが呼び出されているのです。
特に「フォルダおよびファイルリストの照会」APIは、DirectCloudの操作体験を支える、もっとも基本的なAPIの1つです。ファイルの表示や移動、検索結果の取得など、すべてのユーザーが日常的に利用する操作の裏側で動いています。
このAPIサーバーは、従来PHP言語で構築されていました。PHPはWebアプリケーション開発の分野で広く使われてきた実績ある言語です。
PHPの一般的な実行モデルでは、リクエストごとにプロセスやスレッドを割り当てるため、同時接続数が増えた場合、サーバーのメモリやCPUリソースが急速に消費され、全体のレスポンスが低下してしまいます。
ファイル数が多いフォルダの一覧表示や、大量のユーザーが同時にアクセスする時間帯の応答遅延は、ユーザー体験に直結する課題でした。
約80%高速化 – Go言語への移行で並行処理がもたらすレスポンス改善
レスポンス低下の課題に対してDirectCloudが選択したのは、該当するAPIサーバーの開発言語をPHPからGo言語に移行するという、抜本的なアプローチです。
今回のアップデートでは、システム内部で利用されている「フォルダおよびファイルリストの照会」APIをv1からv2に刷新し、WebアプリおよびモバイルアプリのAPIサーバーを一新しました。
Go言語のゴルーチン
Go言語が高負荷環境に強い理由は、その独自の並行処理モデルにあります。
Go言語には「ゴルーチン(goroutine)」と呼ばれる軽量な並行処理の仕組みが備わっています。
ゴルーチンは、通常のOSスレッドと比較して極めて少ないメモリ(わずか数KB程度)で動作するため、1つのサーバー上で数千〜数万の同時リクエストを効率的にさばくことができます。
APIサーバーの言語を「Go」に移行
-
① 開発背景・課題
PHPの従来型プロセスモデルでは、同時接続数が一定のラインを超えた場合に、メモリやCPUが急速に逼迫し、新たなリクエストが待ち行列に入ってしまうことがありました。
-
② 改善内容
Go言語では、軽量なゴルーチンがリクエストを並行処理するため、同じサーバーリソースでもはるかに多くの接続を同時に受け付けることが可能です。
-
③ メリット
コネクションプールによってデータベース接続をあらかじめ確保しておくことができ、処理完了後のコネクションはすぐに次のリクエストへ再利用されます。これにより、接続待ちによる遅延を大幅に低減しています。
リクエストが同時に集中した場合でも、APIサーバーへの負荷が低減されます。
社内テスト環境において、最大で約80%の応答時間短縮を確認しています。(※測定条件により、結果は異なる場合があります)
わかりやすく例えた場合は、以下のようなイメージとなります。
-
●PHPは「1つの窓口に1人の担当者」を配置するモデル
-
●Go言語は「1人の担当者が複数の窓口を素早く切り替えて対応する」モデル
窓口の数(サーバーリソース)が同じでも、対応できる来訪者(リクエスト)の数に大きな差が生まれます。
これにより、アクセスが集中する時間帯でもレスポンスの低下を抑え、安定した快適な操作をユーザーに提供できるようになりました。
なお、DirectCloudでは今回のフォルダ・ファイルリスト照会APIに限らず、段階的にAPIサーバーのGo言語移行を進めています。
すでに一部のAPIでは先行してGo言語への移行が完了しておりますが、システムの応答速度と安定性については、今後も継続的に改善を重ね、より快適でストレスフリーな利用環境を整えていく予定です。
まとめ
今回のアップデートでDirectCloudは、「AI回答精度の向上」と「インフラ応答速度の改善」という利用環境の向上に直結する2つの重要な改善を実施しました。
-
●文書パーサーの刷新により、ドキュメント構造情報がAIに正確に伝わるようになったことで、日々の業務における「AIへの質問」がより実用的かつ信頼できるものへと進化。AI回答精度の向上に。
-
●APIサーバーの開発言語を変更して最適化したことにより、応答速度を改善し約80%高速化。
これら2つの改善は、それぞれ独立した施策でありながら、「社内のナレッジを、必要なときに、速く、正確に届ける」という共通の目標に向けて相互に作用し、利用環境のさらなる向上を支えています。
さらにDirectCloudでは、今回の改善を出発点として、チャンキングの強化、エンベディングの刷新、リランキングの追加、Hybrid Searchの実装といったRAG精度を段階的に引き上げるロードマップを策定し、順次実装を進めています。
参考:社内文書を安全にAI活用するために——DirectCloud AIが実現する高精度RAGの技術的基盤
「AIに聞けば、すぐに正確な答えが返ってくる」——そんな当たり前の体験を実現するために、DirectCloudは見えない土台の部分から着実に進化を重ねています。
一度きりの改善ではなく、継続的な進化によってAI活用の価値を最大化していく——それがDirectCloudの開発思想です。

よくある質問(Q&A)
- 今回のパーサー刷新は、どのような文書や質問で特に効果を感じやすいですか?
-
表や脚注、見出し構造を多用する文書で効果が顕著にあらわれます。
たとえば四半期報告書の売上一覧への数値照会、契約書の条項単位での検索、議事録のセクション別要点抽出など、文書の構造理解を前提とした質問で、従来よりも的確な回答が得られるようになります。 - 「最大で約80%の応答時間短縮」とありますが、これはどのような条件で計測された数値ですか?
-
DirectCloudの社内テスト環境において、APIリクエストを10回実施した際の平均値です。
実際の利用環境ではフォルダ内のファイル数、フォルダ階層の深さ、ネットワーク状況などによって結果が変動しますので、あくまで目安としてご参考ください。 - これらのアップデートは、DirectCloudを初めて利用するユーザーにも関係しますか?
-
はい、既存ユーザー・新規ユーザーを問わず恩恵を受けられます。
パーサー刷新はDirectCloud AIが有効なフォルダにファイルをアップロードした時点から自動的に適用されるため、特別な設定は不要です。
またAPIサーバーのGo移行によるレスポンス改善は、フォルダ/ファイルの操作を行うすべてのユーザーに即座に反映されます。

