ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム

 

著者: ジョディ・アーチャー (著),‎ マシュー・ジョッカーズ (著),‎ 川添 節子 (翻訳),‎ 西内 啓 (監修)

出版社: 日経BP社

発売日:2017/3/24

 

東野圭吾の短編『超読書機械殺人事件』に「ショヒョックス」という機械が登場する。
小説を読み込ませると、書評家の代わりに作品の採点を行い、もっともらしいレビューを出力してくれるスグレモノだ。

出版社への忖度や締め切りに悩む書評家にとって、これほどありがたいものはない。
書評家でなくても興味が沸く。
機械が本を「読む」ということはどういうことを意味するのか。

「ショヒョックス」の未来は、実はすぐそこに迫っている。
『ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム』は、テキストマイニングの先端技術を駆使して実現した、リアル「ショヒョックス」といっていいかもしれない。
ただし、こちらは書評を書く代わりに、ベストセラー本を予測し、当てる。

 

ベストセラーの隠し味

 

コンピューター・モデルに多数の小説を学習させ、数千という特徴を調べ上げた結果、ベストセラーの法則が明らかになった―
いかにも眉唾な話だ。
出版社の編集者が聞いたら鼻で笑うかもしれない。

しかし、本書で紹介されるモデルは、実際のベストセラーを、「ベストセラーになった」という事前情報なしで、ベストセラーになるだろうと判定するのだ。
ダン・ブラウンの『インフェルノ』(言わずもがな、『ダヴィンチ・コード』の続編である)がヒットする可能性を95.7パーセント、『ハリー・ポッター』でおなじみのJ.K.ローリングの作品がヒットする可能性を95パーセントと判定する。
ベストセラーとなった作品のうち、8割をベストセラーであると判定し、ベストセラーとならなかった作品のうち、やはり8割をベストセラーでないと判定した。
つまり、『ベストセラーコード』のモデルはかなり正確にベストセラーと非ベストセラーを判断する。

となると、気になるのは、モデルは小説のどの要素を拾って、売れる小説と売れない小説を区別しているかということだろう。
巷にあふれる創作指南の本によくあるような、三幕構成であるとか、共感を呼ぶキャラクターが果たしてコンピューターにとっても重要な意味を持つのだろうか。

 

たしかに、コンピューターはキャラクターの特徴も物語の起伏も、一面ではベストセラーに関わる特徴として捉えた。
しかし、こちらの予想よりももっと即物的に、意表を突くような特徴をモデルは明らかにする。

三幕構成は、ポジティブな感情とネガティブな感情にまつわる単語の多寡がつくる波として表される。
また、キャラクターについては、使われる動詞をもとに判定され、より主体性が表現された文章が売れると判定される。
ここまでは、なんとなく想像できる。
意外に思えるのは、ベストセラーには必ずといっていいほど日常の場面、家族との安らぎや休日の過ごし方が描かれているという点。
名画に隠された暗号の真相に迫ったり、仇敵と対峙する場面という、いわゆるヤマ場のようなものは、モデルの判定にとって必ずしも必要ではないのだ。
さらに、句読点や冠詞の数といった、人間が普通に読むだけでは全く分からないベストセラーの特徴も、コンピューターは拾う。
およそクリエイティビティとは無関係に思える要素が、ベストセラーに通底するDNAとして隠されていたと知るのはワクワクする。

 

テキスト・マイニングが明らかにする「売れる」作品のDNA

 

本書のモデルは機械学習とテキスト・マイニングをキモとする。
門外漢にも分かる範囲で、手法の簡単な解説も本書の最後に記載されているため、「ベストセラーの予言者」に半信半疑の読者も目を通せば唸らせられること必至である。
モデルの構築はなかなかに地道な道程をたどる。
ベストセラーの予言は決して魔法ではない。

ちなみに、著者がことわりを入れているように、ベストセラーの特徴を明らかにしたからといって、面白い小説とそうでない小説を分けたり、あるいは機械もベストセラー作家になれるといったことを著者は主張しているのではない。
ベストセラーかそうでないかを分かるということと、面白くて売れる小説を生み出すということには開きがある。
なので、本書が提供する特徴を盛り込んだからといって、残念ながら小説が売れるわけではない。

しかし、機械が本を「読む」というのは重要な出発点であるようにも思える。
もしかしたら、AIが発達した未来には、読み手のみならず、書き手としての「ショヒョックス」が生まれるかもしれない。
であれば、ベストセラーの作者がAIという未来も、もはや夢想ではなくなってきているのかもしれない。