ねらい
SNSや検索で見つけた情報の真偽を、要素分解 → 機械的に判定 → 自動で監視する流れの中の、機械的に判定するルールを整理します。専門用語はできるだけやさしく説明します。
この記事の目標
- 情報の「正しさ」をはっきり定義する
- 判定に使う8つの要素を決める
- それを点数化して自動チェックする仕組みをつくる
問題提起―AIが量と速度を“過剰供給”する時代
動画・画像・テキストが自動で作られるようになり、見た目も言い回しもとても上手です。広がる速さは人間の確認を軽く追い越します。岐阜県大垣市のような地域では、ちょっとした勘違いでもお店の集客・学校の安全・役所の窓口に影響が出ます。間違った口コミが一気に広がることもあります。
「正しい」とは何かを定義する(行政ガイドラインの考え方)
行政機関である個人情報保護委員会の「特定個人情報の適正な取扱いに関するガイドライン(行政機関等編)」や関連の個人情報保護法のガイドラインを参照すると、
「利用目的に合うように、情報を正確かつ最新に保ち、不利益が出ないよう管理する」ことが求められます。これは個人情報の話ですが、“情報の正確性を保つ態度”は日々の情報判断にも応用できます。
参考文献
https://www.meti.go.jp/shingikai/sankoshin/shomu_ryutsu/bio/kojin_iden/pdf/007_03_00.pdf
https://jsite.mhlw.go.jp/yamanashi-roudoukyoku/content/contents/001621954.pdf
https://www.ppc.go.jp/files/pdf/kihon_202309.pdf
では、プログラマとしてファクトチェックのワークフローを自動化するにあたって、このような正しさの定義をプログラムで制御可能な形に言語化する必要があります。
自動化「正しい」を言語化して再定義
今回の文脈において、自動チェックしやすいように、次の8因子で判定します。
- 出どころ:だれが言っているか(発信者と責任の明確さ)
- 一次根拠:元の資料・データ・規則へのリンクがあるか
- 再現性:同じ手順でだれでも同じ結果になるか
- 整合性:独立したほかの信頼できる情報と矛盾しないか
- 鮮度:情報は最新か(更新日があるか)
- 利害の開示:広告・アフィリエイトなどがはっきり書かれているか
- 技術的健全性:URLがhttpsか、配布物の署名・由来が確認できるか
- 表現の妥当性:「絶対」「100%」「至急拡散」など極端な言い方が多くないか
要素の詳しい対策
出どころ
- 対策:実名・連絡先・運営者。自治体は city.ogaki.lg.jp、県は pref.gifu.lg.jp など公式ドメインを優先。
- 例:水道料金の変更→大垣市公式の告知と照らし合わせる。
一次根拠
- 対策:議事録、条例、統計、プレス原本へのリンク必須。
- 例:イベントの来場者数は主催者の実数カウントと突合。
再現性
- 対策:計測条件(日時・場所・機材・手順)を明記。
- 例:商店街の売上比較→対象期間・天候・催事有無を合わせる。
整合性
- 対策:独立メディアや公的資料と最低2件クロスチェック。
- 例:学校の休校情報→教育委員会+学校公式の二面確認。
鮮度
利害の開示
- 対策:PR/アフィ表記の有無を明示。強い利害は自動減点。
技術的健全性
- 対策:https、短縮URL警告、署名・配布由来(provenance)を点検。
表現の妥当性
- 対策:「絶対」「至急拡散」などの極端表現を機械検出し減点。
自動化の設計をする
ワークフローの自動化は以下のプロセスで行うことを考えています。
全体フロー
- 収集:RSS/ブックマーク/SlackのURLをJSON収集
- 解析:HTMLからタイトル・著者・更新日・外部リンクを抽出
- 採点:8因子を定量化(加点・減点)
- 通知:しきい値でHIGH 保存/CAUTION 要確認 /RISK 要注意に分類し、配信
スコア基準
- 公式ドメイン(*.lg.jp, *.go.jp, *.ac.jp)リンク数:多いほど加点
- 更新日が1年以内:加点/古い:減点
- PR/アフィ:減点
- 短縮URL:減点
- 極端表現:出現回数に応じて減点
- 独立ソース照合数:多いほど加点
限界と今後の拡張
- テキスト中心の雛形です。画像・動画の真偽(ディープフェイク等)はメタデータや逆画像検索が必要。
- 検索APIやニュースAPIを使うと、独立ソース照合を自動化できます。
- 配布物の安全性は署名(provenance)やハッシュでの確認を追加してください。
まとめ
- 正しさは感覚ではなく、因子×スコアで扱う。
- まずは「公式ドメインの一次根拠」と「極端表現の検出」だけでも効果大。
- 岐阜・大垣の現場では、毎朝の自動レポートでRISKを早めに見つけ、人が落ち着いて精査する体制づくりがポイントになります。
お問い合わせ
- 導入相談:判定ルールの調整/学校・企業・自治体向けの運用設計/朝レポートの自動化
- サンプル運用:あなたのURLリストで試験判定 → 改善提案をレポートでご提示
- 次の一歩:画像・動画のチェック、署名検証、検索API連携など段階的な拡張
お問い合わせフォーム
https://docs.google.com/forms/d/e/1FAIpQLSdObYdxcSRsSp7oaOPsiUOA0nWMzzo7ZHXYxs1lcF0DEkuN3w/viewform
ねらい
SNSや検索で見つけた情報の真偽を、要素分解 → 機械的に判定 → 自動で監視する流れの中の、機械的に判定するルールを整理します。専門用語はできるだけやさしく説明します。
この記事の目標
問題提起―AIが量と速度を“過剰供給”する時代
動画・画像・テキストが自動で作られるようになり、見た目も言い回しもとても上手です。広がる速さは人間の確認を軽く追い越します。岐阜県大垣市のような地域では、ちょっとした勘違いでもお店の集客・学校の安全・役所の窓口に影響が出ます。間違った口コミが一気に広がることもあります。
「正しい」とは何かを定義する(行政ガイドラインの考え方)
行政機関である個人情報保護委員会の「特定個人情報の適正な取扱いに関するガイドライン(行政機関等編)」や関連の個人情報保護法のガイドラインを参照すると、
「利用目的に合うように、情報を正確かつ最新に保ち、不利益が出ないよう管理する」ことが求められます。これは個人情報の話ですが、“情報の正確性を保つ態度”は日々の情報判断にも応用できます。
参考文献
https://www.meti.go.jp/shingikai/sankoshin/shomu_ryutsu/bio/kojin_iden/pdf/007_03_00.pdf
https://jsite.mhlw.go.jp/yamanashi-roudoukyoku/content/contents/001621954.pdf
https://www.ppc.go.jp/files/pdf/kihon_202309.pdf
では、プログラマとしてファクトチェックのワークフローを自動化するにあたって、このような正しさの定義をプログラムで制御可能な形に言語化する必要があります。
自動化「正しい」を言語化して再定義
今回の文脈において、自動チェックしやすいように、次の8因子で判定します。
要素の詳しい対策
出どころ
一次根拠
再現性
整合性
鮮度
利害の開示
技術的健全性
表現の妥当性
自動化の設計をする
ワークフローの自動化は以下のプロセスで行うことを考えています。
全体フロー
スコア基準
限界と今後の拡張
まとめ
お問い合わせ
お問い合わせフォーム
https://docs.google.com/forms/d/e/1FAIpQLSdObYdxcSRsSp7oaOPsiUOA0nWMzzo7ZHXYxs1lcF0DEkuN3w/viewform