毎年、夏になるとメディアもそうだが、なんとなく戦争物の書籍を読んでみたくなる。今年、手にしたのは『コード・ガールズ』。ここで言うコードとは暗号のこと。要は、暗号解読に係わった女性たちの物語である。ただし、アメリカの物語であり、太平洋戦争中、日独の暗号を解読するために活躍したアメリカ人女性たちの生き方を描いている。日本人としては複雑な思いで読むのだが、ここにも日本の敗戦につながった本質が隠されているように思える。
それは、アメリカの方が暗号解読技術において先行していた、ということではない。女性たちこそ暗号解読に向いていると見抜き、若い女性たち――多くは教職についていた――を動員して、暗号解読学Cyptanalysisという学術領域を切り拓いていったことである。
当時のアメリカでは、職業を持つ女性は限られていたし、たとえ職業を持っていたとしても結婚を機に退職することが、社会的な風習だった。まるでバブル前の日本のようだったのだ。そうした社会風習の中でも、女性の持つ忍耐強さや、数学的な素養以外に言語学のセンスに目をつけ、男性の職種だった暗号解読を女性の仕事に変えていった。そうした革新性が優位性に結びついていったようだ。
ところで、データサイエンティストの男女比はどうであろう。アメリカの場合ですら、現時点で男性8割女性2割が現状である。ジェンダー平等の意識が強いアメリカであっても、こうしたアンバランスな現状にある。でも、それは太平洋戦争前の暗号解読の職場環境に似ているのかもしれない。
では、日本はどうかというと、データサイエンティスト協会のアンケート調査によれば、男性9割、女性1割ということである。アメリカよりもさらに不均衡な状況にある。私自身、自社のためにリクルーティングをしていても、女性候補者に滅多に出くわすことはない。それでも当社が採用した13人のデータサイエンティストのうち2人が女性である。母数が少ないので、どうだか怪しいところだが、日本の平均値よりも上回っているのかもしれない。
データサイエンスも、暗号解読学同様に忍耐強さが求められる。分析する対象のデータセットを丁寧に作り込まないと、データ分析をしても精度のある答えが得られない。データがきれいなことはなく、さまざまなファイルや出所から寄せ集められるものであり、しかも異常値もあり、いたるところに欠損値も見られる。こうしたデータを統合し、クレンジングしていくことが、データ分析の品質を上げることにつながることは、誰もが知る真実である。また、モデリングを行うときも、ウォーターフォール型のアプローチが通用せず、行ったり来たりを繰り返し、ようやく精度の出るモデルに辿り着く。
こうした事象を思い浮かべれば、将来は女性データサイエンティストがデータ分析の世界を席巻しているのかもしれない。あるいは、違う素養をもって、男性が主流のままなのかもしれない。
当社は男性であっても女性であってもWelcome。才能があって、忍耐力があって、プロフェッショナルとしてクライアントにコミットしてくれれば、性別は問わない。クライアントに価値をもたらす者だけが、Colleagueと呼びあうファームなのである。