AIなのに、手作業が必要。そんな話を聞いて「そうそう、そのとおり」と頷いた人は、人工知能をはじめとしたテクノロジー事情に詳しい方。
AIすなわち人工知能と聞くと、すべてを解決するように勘違いしている人がいます。まあ、そう勘違いする人は、RPAを使えばあらゆることが解消し、マーケティングオートメーションを使えば今までにないソリューションを提供する、と考えがち。
いやいやいや、そんなことはないんです。なぜなら、「前処理」が必要だから。
マシンにデータを処理させるには、そのマシンが処理できる形でデータを整えてあげないといけない。これが、「前処理」と呼ばれる作業。マシンが取り扱えるように、同じ形式に揃えないとダメ。
例えば、会計システムの仕訳データを、CSV形式でマシンに読み込ませることによって、何かの特徴量を抽出しようとします。ここで、あるデータのA列は日付欄なのに対して、別のデータのB列が金額欄という状況では、マシンは困ってしまう。
A列には日付が、B列には借方科目が入力されていると統一した形にしてあげる必要があります。このように、データのすべてについて形式を揃えてあげなければなりません。こうした前処理があってこそ、マシンはデータを理解できるのです。
この前処理は、AIでなくても、統計処理を行うには必ず必要な工程。学術的な研究でも、ここは苦労されているそうです。それが実務となると、かなり大変。
わかりやすいところでいえば、今の連結PLの「当期純利益」には、非支配株主の損益が含まれています。しかし、2013年に「連結財務諸表に関する会計基準」や「包括利益の表示に関する会計基準」が改正される前までは、非支配株主の損益が含まれていませんでした。表示科目も「少数株主損益調整前当期純利益」。
だから、過去何年か分の財務諸表のデータをマシンに読み込ませるには、今の「当期純利益」と改正前の「少数株主損益調整前当期純利益」とを同じ行もしくは列となるように、データを前処理しておく必要があります。
これが、ひとつの会社の財務諸表なら、前処理も大変ではありません。しかし、上場企業は約3,600社程度。これのすべてについて、こうした表示科目も含めて、すべての形式を揃えてあげないといけない。
さらにやっかいなのが、IFRSや米国企業を採用している会社の財務諸表。日本の有価証券報告書の財務諸表だと、同じ箇所に同じ財務情報が記載されているため、揃えたり、探したりするのはやりやすい。しかし、IFRSなどでは、どこにどんな財務情報があるのかを探すだけでも一苦労。そんな財務諸表について前処理しないといけない。
一社ごとに判断が必要なため、RPAも適していない。すると、人手による作業は避けられません。だから、AIというデジタルの世界でデータを処理するために、前処理というアナログの世界を通らざるを得ないこともあるのです。
今年の日本監査研究学会の第42回全国大会でも、前処理の必要性が指摘されていました。2019年8月3日に開催された「テクノロジーの進化と監査(最終報告)」で、それが報告されていたのです。
このことは、一年前に、ボクが所属する事務所の全国合同研修で伝えていました。2018年7月7日に、「監査業界のIT・AI動向」というテーマで研修講師を務めていたからです。60分という短い時間の中で、ストロングAI・ウィークAI、フレーム問題なども説明する中で、「前処理」が実務上の課題になることについても説明しました。やはり、行き着く先は、同じですね。
とはいえ、今は手作業が必要でも、来年には安価で自動処理できるようになっているかもしれません。そのためにも、テクノロジーの動向には注目しておくべき。つい先日も、オンラインセミナーの海外システムをいくつか目の当たりにしたところ。ホント、目が離せませんよ。