AI活用概論

AI機能分類とデータ構造の関係

この章のねらいは、AI の機能を「できること」で覚えるだけでなく、どんなデータの形に、どんな AI が向きやすいかを判断できるようになることです。

第1章では生成AIの基本と人間との役割分担を学んだので、この章ではそこから一歩進み、AI の使いどころは、モデルの種類だけでなく、入力データの構造にも強く左右されるという実務上の前提を整理します。

ここが見えると、生成AIをどこで使うか、抽出や分類や予測をどこで使うかを、感覚ではなく構造で考えられるようになります。

はじめに

前の章までで、生成、分類、抽出、要約、検索支援、予測、推薦、異常検知など、AI にはいくつもの機能があることを見てきました。ただ、ここでまだ一つ大きな穴があります。それは、同じ AI 機能でも、入力するデータの形が違うと、向き不向きが変わるという点です。たとえば、売上表のような表データ、請求書の PDF、会議の録音、SNS のコメント欄では、使いやすい AI の型が違います。

この章では、その違いを「データ構造」という言葉で整理します。ここでいうデータ構造とは、難しいプログラミング用語としてではなく、情報がどのような形で並んでいるか、整理されているか という意味です。行と列でそろった表、項目名が決まっている JSON、文章が長く続く PDF、画像、音声などは、それぞれ違う構造を持っています。そして、その違いが AI の得意不得意に直結します。

この章の読みどころは、単に「構造化データとは何か」「非構造化データとは何か」を覚えることではありません。大切なのは、課題を見るときに、まずデータの形を見て、そこから向く AI 機能を考える癖をつけることです。これができると、同じ「AI を入れたい」という相談でも、かなり精度高く見立てができるようになります。

1. まず押さえたい前提:AIはデータの形で強みが変わる

1-1. データ構造とは何か

この章でいうデータ構造とは、情報がどのように整理され、どのような形で保存されているか のことです。高校のノートでたとえるなら、表形式で整理したテスト結果、自由記述の感想文、授業の録音、配布資料の PDF は、それぞれ違う形の情報です。AI は賢そうに見えても、どんな形の情報を受け取るかによって、得意なことが変わります。

ここで注意したいのは、「データ構造」という言葉を、配列や木構造のようなプログラミング用語と混同しないことです。この章ではもっと広い意味で、表なのか、文書なのか、画像なのか、音声なのか という情報の姿を指しています。この理解がないまま AI を選ぶと、「賢いモデルなら何でも同じように扱える」と思い込みやすくなります。

1-2. なぜ AI 機能とデータ構造を一緒に学ぶ必要があるのか

AI の機能は、入力の形にかなり左右されます。たとえば、表形式の売上データなら予測や異常検知が向きやすく、長文の契約書なら抽出や要約が向きやすくなります。画像の請求書なら、いきなり文章生成を考えるより、まず OCR、つまり画像の中の文字を読み取る技術や文書抽出の発想が先に来ます。Google Cloud の Document AI も、文書からの分類・抽出・分割を前面に出していて、文書処理では「まず構造を理解して整える」ことが重要だと分かります。

初心者がここでつまずきやすいのは、「AI の種類を選べば終わり」と思うことです。実際には、AI 機能の選定より前に、「その課題で扱うデータはどういう形か」を見なければいけません。つまり、AI の選び方は、機能の話だけでなく、入力データの話でもあります。

1-3. 第1章からここまでの整理

第1章では、生成AIが新しい文章や画像やコードを作るのが得意であり、最終判断や厳密な保証は人間側に残りやすいことを学びました。第2章前半では、生成、分類、抽出、要約、検索支援、予測、推薦などの機能を見てきました。この章では、その続きとして、「その機能はどんなデータに向いているのか」を見ます。ここで初めて、AI 機能の理解が現実のデータ処理とつながります。

まとめ

この章の出発点は、AI の能力をモデル名だけで考えないことです。まずは、情報が表なのか、文書なのか、画像なのか、音声なのかを見る。この視点を持つだけで、AI の選び方はかなり安定します。

2. 初心者が最初に混同しやすい「データの種類」

2-1. 構造化データとは何か

構造化データとは、あらかじめ決まった項目に沿ってきれいに並んでいるデータです。たとえば、名前、年齢、住所、点数のように、列の意味が決まっている表がこれに当たります。Excel の表、Google スプレッドシート、顧客台帳、売上表、フォーム回答、データベースのレコードなどが典型です。IBM は structured data を、固定スキーマ、つまり決まった設計に沿って行と列へ整理されるデータとして説明しています。

ここでの初心者の誤解は、「数字が入っていれば構造化データ」というものです。しかし実際には、数字でなくても、項目がきちんと決まっていれば構造化です。たとえば「氏名」「学年」「所属部活」という表も構造化データです。逆に、数字が入っていても、形式がばらばらで文脈依存なら、単純には構造化と言いにくいことがあります。

2-2. 非構造化データとは何か

非構造化データとは、きれいな行と列にそのまま収まりにくいデータです。メール本文、議事録、レポート、PDF、画像、動画、音声、SNS コメントなどがこれに当たります。IBM は unstructured data を、固定されたスキーマを持たないデータとして説明しています。人にとっては意味が分かっても、機械にとっては「どこが何の項目か」が見えにくいことが多いです。

たとえば、同じ請求書でも、CSV で項目が分かれていれば構造化寄りですが、画像や PDF で届けば非構造化寄りになります。ここでの重要な発見は、内容が同じでも、保存形式が違うと AI から見た扱いやすさが変わるということです。

2-3. 半構造化データとは何か

半構造化データとは、構造化と非構造化の中間にあるデータです。JSON、XML、HTML、Markdown のように、ある程度ルールや見出しはあるが、表ほど厳密ではないものがこれに当たります。項目の区切りやラベルはあるけれど、すべてが同じ形で埋まっているとは限らない、というイメージです。

初心者は、データを「構造化か、非構造化か」の二択で考えがちです。しかし、現実のデータは中間的なものが多いです。たとえば API のレスポンス JSON は半構造化データの代表ですし、見出しと本文がある Markdown もそうです。この中間を知っておくと、AI との相性を現実的に考えやすくなります。

2-4. なぜこの区別を先に押さえるのか

この三つを先に押さえる理由は、後で AI 機能を当てるときに迷わないためです。たとえば「この課題には生成AIか、抽出AIか」と悩んだときも、まず入力が表なのか文書なのか画像なのかが見えれば、かなり判断しやすくなります。つまり、データの種類を知ることは、AI の選定に入る前の準備運動です。

まとめ

構造化、非構造化、半構造化の違いは、AI 選定の土台になります。ここを曖昧なまま進むと、後で「同じ AI なのに、ある課題ではうまくいき、別の課題ではうまくいかない」理由が見えにくくなります。

3. AI機能ごとに相性のよいデータ構造は違う

3-1. 生成系が扱いやすいデータ

生成系は、文章、画像、音声のような非構造化データと相性がよい場面が多いです。文章の下書き、画像案、会話応答、音声の言い換えなどは、自由度が高い入力から新しい出力を作る処理です。ChatGPT の概要でも、学習、作成、会話、検索のような文脈で使われており、自然言語のような柔らかい入力に強いことが分かります。

ただし、「生成系は何でも得意」というわけではありません。表データをそのまま読ませて自由生成させると、表の意味をそれっぽく文章化できても、予測や異常検知のような数理的な仕事とは違う強みになります。ここで大事なのは、生成系は情報を新しい表現に変えることに強いのであって、すべての形式で最適とは限らないという点です。

3-2. 分類・判定系が扱いやすいデータ

分類や判定は、構造化データにも非構造化データにも使えますが、共通しているのは「何をどの箱に入れるか」が決まっていることです。問い合わせ文をカテゴリに分ける、画像にラベルを付ける、レビューを感情別に分ける、表データのレコードを状態別に分ける、といった処理です。ここでの相性は、「ラベル付けしやすいかどうか」「過去の例があるかどうか」に左右されます。

初心者がここで誤解しやすいのは、「分類は文章にしか使わない」ということです。実際には、表のレコードにも、画像にも、音声書き起こしにも使えます。違うのは入力形式であって、返すものがラベルであるという点は共通です。

3-3. 抽出・要約・検索支援が扱いやすいデータ

抽出、要約、検索支援は、特に長文文書や文書集合との相性がよいです。契約書、請求書、議事録、マニュアル、FAQ、授業ノートなどは典型です。Document AI は、文書からの分類・抽出・分割を行い、OCR は画像から文字を取り出します。つまり、文書系の課題では、いきなり生成するより先に、読める形にする、項目を抜く、関連情報を見つける といった処理が必要になります。

ここでのつまずきやすい点は、要約と抽出と検索支援を全部同じだと思ってしまうことです。要約は「短く言い直す」、抽出は「必要な項目だけ取る」、検索支援は「見つけやすくする」という違いがあります。同じ文書を扱っていても、求める出力はかなり違います。

3-4. 予測・推薦が扱いやすいデータ

予測と推薦は、構造化データや半構造化データと相性がよいことが多いです。売上推移、在庫数、クリック履歴、閲覧履歴、学習履歴、購買履歴のように、時系列や行動履歴が並んでいるデータです。ここでは、「過去のパターンから次を見積もる」「候補の中から次を出す」という処理が中心になります。

初心者はここで、推薦も生成の一種だと感じることがあります。ですが、推薦は新しい文章を作ることではなく、既にある候補の中から次に合いそうなものを出す ことが中心です。この違いが見えると、生成と推薦を混同しにくくなります。

まとめ

AI 機能は、何を返すかで違うだけでなく、どんなデータを入れると力を発揮しやすいかでも違います。生成は非構造化データに強みが出やすく、抽出や検索支援は文書に強く、予測や推薦は履歴や表に強みが出やすい、という全体像をまず持つことが大切です。

4. 同じAIでも、入力形式が変わると使い方が変わる

4-1. テキスト入力のとき

テキスト入力は、一番身近で、しかも誤解が起きやすい入力形式です。チャットAIが有名なので、テキストを見るとすぐ「生成AIだ」と思いやすいからです。けれど、テキストでも役割はかなり分かれます。レビュー文を短くまとめるなら要約、問い合わせ文を「返品・配送・支払い」に分けるなら分類、社内規程から関連箇所を見つけるなら検索支援、質問への説明文をつくるなら生成、といった具合です。

つまり、入力が同じ「文章」でも、求める出力が違えば向く AI 機能も変わります。ここで持ち帰ってほしいのは、テキスト = 生成AI ではない ということです。

4-2. 画像入力のとき

画像も、初心者が「画像AI = 画像生成」と思いやすい領域です。しかし、画像には OCR、画像分類、画像理解、画像生成など、かなり多くの機能があります。たとえば、請求書の写真から文字を読み取るのは OCR、商品写真をカテゴリ分けするのは画像分類、写真の中に何が写っているか説明するのは画像理解、広告バナー案を新しく作るのは画像生成です。

同じ画像入力でも、「読み取りたい」のか、「見分けたい」のか、「説明したい」のか、「新しく作りたい」のかで使い方が変わります。ここを区別できると、画像系の AI をかなり立体的に見られるようになります。

4-3. 音声入力のとき

音声入力では、まず音声認識、つまり音を文字にする 処理が入口になることが多いです。そのあと、文字起こしを要約する、発言者ごとに整理する、質問内容を分類する、といった次の処理が続きます。会議録音、授業音声、コールセンター通話は、単に「音声を AI に入れる」だけでは終わらず、音声 → テキスト → 要約 / 分類 / 検索支援へつながることが多いです。

ここでの発見は、音声はそのまま一気に理解させるより、途中でテキストへ変換してから別の AI 機能につなぐと使いやすい ことが多い、という点です。

4-4. 表・時系列入力のとき

表データや時系列データでは、予測や異常検知の発想が強くなります。売上の推移、学習履歴、在庫推移、アクセスログ、出席記録などは、行と列や時間順に整理されているので、「次どうなりそうか」「普段と違う動きはどこか」を見つけやすいです。ここで生成AIを使って表を説明させることはできますが、中心機能は「説明」になりやすく、「見積もり」や「検知」は別の機能のほうが自然です。

まとめ

同じ AI でも、入力形式が変わると役割が変わります。テキスト、画像、音声、表の違いを見るだけで、かなり判断しやすくなります。AI を選ぶときは、「どの AI か」だけでなく、「何を入れるのか」も同じくらい重要です。

参考文献

教材トップへ戻る