概要
最近は生成AIでドキュメントを書く人が増えています。
一方で「AIが書いた文は長くて読みにくい」と感じることがあります。
ここではそれについて以下の視点から説明します。
- AI向け・人間向けドキュメントの違い
- 図とチャンク
- 図があると人間にとって理解しやすい理由
- チャンクとワーキングメモリ
- 画面で読むと脳が"パターン認識モード"になる可能性
- 書き手と読み手
- なぜ「書き手はラク・読み手はツライ」現象が起きる?
- 本も同様に大量の情報量だが問題視されないのは?
- 読み手への意識
AI向け vs 人間向けドキュメント
まずAIにとって重要な要素、人間にとって重要な要素を分類してみます。
| ポイント | AIに必要 | 人間に必要 | 違い |
|---|---|---|---|
| はっきりした見出し (=構造) |
◎ | ◎ | - |
| メタデータ(JSON・YAMLなど) | ◎ | △(直接読まない) | AIは必須 |
| 読み手の意識 | △(情報を全て入れてOK) | ◎ | 読み手のレベル、求めている情報の取捨選択が必要 |
| ストーリー性 (背景→問題→解決) |
△ | ◎ | 人は共感で理解が深まる |
| 図や写真 | △(altテキスト必須) | ◎ | 人は視覚で瞬時に理解 |
| 修辞・比喩 | △(ノイズ) | ◎(記憶に残る) | 人向け装飾 |
まとめると以下です。
- AIで重要なのは構造とメタデータ
- 人で重要なのはストーリー+図+感情による頭に入りやすさ(=納得感)
図とチャンク
図があると人間にとって理解しやすい理由
僕自身も新しい概念を理解する際に「画像検索で調べてイメージをつかむ」ということをよくしますが、人間にとってなぜ図が良いかを説明します。
進化的アドバンテージ
- 視覚システムは数百万年の進化で最適化。文字はまだ数千年の歴史しかなく、脳の新参者でデコード自体が遅い。
- 加えて文字は「記号→音/意味」へのデコードも必要
二重符号化(Dual Coding)
- 文字=言語コードのみ
- 図=言語コード + イメージコードの2 チャネル で記憶される → 思い出しやすい
ゲシュタルトの法則
- 類似・近接・連結などで要素を瞬時にグループ化 → 「全体像」が即座に見える
- 「関係性を推論して再構成」 する手間が不要
- 類似・近接・連結などで要素を瞬時にグループ化 → 「全体像」が即座に見える
外化(Externalization)
- 情報が紙や画面に描かれているので、頭の中(=ワーキングメモリ)で保持しつづけなくても OK
このように図は「パッと見ただけで意味を取れる」仕組みを持っています。
ここでキーワードになるのが チャンク化 です。
図は複雑な情報を ほぼ 1 チャンク分に圧縮してくれるので、ワーキングメモリ(作業記憶)を圧迫しません。
チャンクとワーキングメモリ
チャンクとは情報のかたまりです。
例として電話番号「09012345678」を「090 - 1234 - 5678」の 3チャンク にすると見やすい・覚えやすいのはその1つです。
一方研究ではワーキングメモリは 4 ± 1 チャンク が同時保持の上限と言われています。
| 表現形式 | 脳内で必要なチャンク数 (イメージ) |
|---|---|
| 長い説明文 | 5〜10 以上(上限オーバー) |
| 箇条書き | 3〜5(上限ギリギリ) |
| 図解 | 1〜2(余裕あり) |
このように図は「複数要素 + 関係性」まるごとを 1 つの視覚オブジェクトとして扱えるため、チャンク数換算で 圧倒的にコンパクト なのです。
長い文章は読者のチャンク枠をすぐ使い切りますし、加えて前述の「ゲシュタルトの法則」のように「関係性を推論して再構成」 する手間あるため読みにくく感じます。
画面で読むと脳が"パターン認識モード"になる可能性
で説明されているのですが、パソコンやスマホの透過光ディスプレイを見ると、脳は映像を処理するパターン認識モードに切り替わりやすいようです。
このモードでは全体をザッと把握する代わりに、細部をチェックする「分析モード」 が弱まり、誤字や論理の飛びを見落としやすいといった問題が起きます。
いわゆる 「スクリーン劣性効果(screen inferiority effect)」(紙よりスクリーンで読解力が落ちる)現象の一因です。
加えてAI生成物は細かい太文字が多く、このパターン認識モードだとそこばかり目について一層理解しにくいのです。
つまり
- AIが出力した長文を PC で読む
- → 画面特有のパターン認識モードが発動
- → チャンク過多に加えて細部を見逃しやすい
- → 画面特有のパターン認識モードが発動
と読みにくさが二重に増幅されるわけです。
書き手と読み手の非対称性
なぜ「書き手はラク・読み手はツライ」現象が起きる?
このようにAI生成物には読みにくさがあるため、書き手も人間としてその読みにくさを感じているはずです。
そうやって書き手が「人間として推敲している」にも関わらず、読みにくさが消えないケースがあります。
これは書き手と読み手の非対称性によるものだと考えます。
| 書き手(AI対話中) | 読み手(完成文を読む) |
|---|---|
| 一問一答で 小さいチャンク ずつ処理 | まとめて 大量チャンク を抱える |
| チャット履歴が外部メモリ | 外部メモリが少なく頭に保持しがち |
| 冗長な内容を削るがコンテキストを理解してるので問題無い | 削られたコンテキストを知らないので論理の飛躍に感じる |
このズレを Curse of Knowledge(知識の呪い) と呼ぶこともあります。
本も同様に大量の情報量だが問題視されないのは?
「なぜ本(特に紙の本)は、情報量が多くても読みづらい問題として語られにくいのか?」を整理します。
編集・校正という蒸留プロセス
- 原稿→リライト→編集→校閲の段階で、冗長表現や重複がそぎ落とされます。また論理の飛躍もチェックされます。
物理パラテキストの豊富さ
- 厚み、ページめくり、余白、索引などが外部メモリとして働き、チャンク負荷を分散。
- スクリーン劣性効果にも関係
一方、電子書籍やAI長文はこの編集工程や物理的手掛かりが弱いため、読者のワーキングメモリを圧迫しやすいです。
これがAI文章の読みにくさに繋がっています。
| 共通する構造的課題 | AIが書く長文 | 電子書籍 | 紙の本 |
|---|---|---|---|
| 外部メモリの薄さ | チャット対話→編集が通らず、そのまま出力されがち | スクロール表示で空間手がかりが弱い | ページ厚み・めくり動作で位置感覚◎ |
| パラテキストの欠如 | 見出しやメタ情報があっても、読者はUIで折りたためない | 余白・索引が省かれがち | 目次・索引・余白がある |
| チャンク圧縮の不足 | 冗長表現が多くチャンク過多 | レイアウト変動で再参照コスト↑ | 編集・校正で情報が蒸留済み |
読み手への意識
これまではAI vs 人間という大きな枠組みでしたが、更に人間の中でも読み手の枠組みが異なります。
良いドキュメントとは
- Effectiveness:必要な情報を正しく得られる
- Efficiency:効率良く理解できる
- Satisfaction:不快さがなく、ポジティブに受け止められる
の3つが揃っている状態を言います。
その上で前提として考える必要があるのが、人間という読み手は異なる情報を必要とするという点です。上記の要素について「誰にとって」を理解した上で構成する必要があります。
- 技術者
- 企画
- 営業
- 経営層
など、それぞれ必要な情報や普段使いする単語自体が異なります。それらを考慮した文章を用意する必要があるのです。
プロンプトで「中学生・高校生にも分かるように」などのテクニックもそれに近いです。しかし社内ドキュメントのような場合はユビキタス言語や業界固有のドメイン知識が多く、抽象的な読み手の指定(=高校生、エンジニア、経営者)ではカバーしきれないケースも多いです。
逆に生成AIに対してはそういった読み手の意識をしなくても済むので、生成AIとの対話ばかりしているとこのような視点が欠けてしまうのに気をつける必要があります。
AIフレンドリーかつ人間が読みやすいドキュメントは可能か?
これまでの内容をまとめると、現時点では1つの同じドキュメントとして提供することは難しいです。
なので
- シングルソースとしてどちらも必要な情報をまとめ、AI向け・人間向けにそれぞれレンダリングできる仕組みを用意する
- モデルの進化を見越して人向けを基準に簡潔さを確保し、AI 用のメタデータを追加しておく
といった方針を何かしら持つ必要があります。
まとめ
AIと人間の読みやすさの違いについて様々な視点から考えてみました。
生成AIを活用しつつ自身のドキュメント作成における参考になれば嬉しいです。