見出し画像

「世界一のリサーチャーエクスペリエンスを生み出し、リハビリを科学するデータ分析基盤の構築に寄与する」Rehab for JAPANの新チームが果たす役割とは

Rehab for JAPANでは、リハビリを科学するためのデータ分析基盤「Care Data Platform(CDP)」の開発を進めています。CDPの開発を担うのは、CTO久良木遼率いる新チーム。今後チームにジョインするデータエンジニア、MLOpsエンジニアに何を求めるか、新チームをどんな組織にしていきたいか、久良木に聞きました。


リハビリを科学できるデータ分析基盤「Care Data Platform」

——現在新チームで取り組んでいるCare Data Platform(CDP)について教えてください。

Care Data Platform(以下、CDP)は、リハビリを科学するためのデータ分析基盤です。

Rehab for JAPANでは「健康寿命の延伸」というミッションを実現するために、リハビリを科学しようとしています。リハビリを科学するために不可欠なのがデータです。

弊社ではデイサービス向けのSaaSとして「リハプラン」というサービスをリリースし、現在約1,200ヵ所の事業所で導入いただいています。リハプランを介して集まった約12万人を超える利用者のデータを分析し、科学に基づいたリハビリを提案するために、CDPの構築を進めています。

現状は、リハプランのデータベースに蓄積された利用者さんのデータと、CDPのDWH(データウェアハウス)を自動化してつなげるフェーズにあり、Google Cloud PlatformのBigQueryで分析用に加工されたリハプランのデータが見られる状態になっています。

——CDPはどんな設計思想のもとで開発に取り組んでいるのでしょうか。

大前提として、リハプランに蓄積しているデータの分析や可視化を自動化しようという考えがあります。エンジニアが細かく手を動かしながら日々データを作るのは現実的とは言えませんので、可能な限りエンジニアの手を介さないよう自動化したいですね。

今後は、誰もがリハビリを科学できる設計にしていこうと考えています。現状のリハプランのデータベースの設計や構造からは、どんなデータが蓄積していて、それがどんな意味を持つのかがわかりづらく感じられます。

介護事業に携わったことがない人にも「何を意味するデータなのか」がわかりやすい設計にする。データを「意味のあるかたち」にして、分析しやすいよう整えていくことが課題だと考えています。

データ活用を円滑にするために、データサイエンスグループとプロダクト開発チームとの「橋渡し」を担う

——新チームの研究開発のプロセスについて教えてください。

業務領域でいうと、データエンジニアは、リハプランに蓄積したデータをもとに、データの加工やクレンジングを行いBigQueryでDWHを作る役割を担います。このDWHからデータサイエンティストや研究者がアルゴリズムを開発し、それをリハプラン側に反映していく環境やパイプラインを作るのがMLOpsエンジニアです。
 
現状の業務プロセスとしては、まず代表の大久保がビジョン、研究の方向性を提示して、それを実現するにはいつまでに何をすればいいのか、データサイエンティストの上田が考えています。

その後、上田と私とで研究のために必要なデータ分析基盤について話をし、どんな仕組みで作るか、どんなデータを持たせればいいかを整理しながら構築していきます。(前回記事

——今後メンバーが増えたら、こうしたプロセスはどう変化していきそうですか?

新しいデータエンジニア、MLOpsエンジニアの方には、私直下の新チームにジョインしていただきます。
 
その中で、データエンジニアは上田率いるデータサイエンスグループが研究をするうえで、BigQuery上にどんなデータが必要で、どんな構造を持たせればいいか、データサイエンスチームにヒアリングをしながらデータ基盤を構築していきます。
 
研究が進んでいくと、どのデータを使ってどの機械学習モデルを用いれば良いかが見えてきた時に、実際のモデルやアルゴリズムを作るための環境の提供や技術的なサポートが必要になります。そういった環境構築や実装したアルゴリズムをリハプラン上で動かすために、どんな構成が必要かを私とMLOpsエンジニアとで話し合います。全体のアーキテクチャを決めて、データサイエンティストや研究者がどうしたら使いやすいか、データサイエンスグループと議論を進めていく。そんなプロセスになると予想しています。

——関連部署としては、データサイエンスグループがメインになるのでしょうか。

今はリハプランからデータが集まる構造なので、プロダクトチームとも関わりがあります。そのため、プロダクトチーム内のPdMやプロダクトデザイナー、プロダクト開発をしているエンジニアと定期的にコミュニケーションを取りながら、どんなプロダクトを作ろうとしていて、どんなデータが集まってきそうかを日々キャッチアップする必要があります。
 
そこで得た情報をデータサイエンティストや研究者に共有することで、研究者は今後集まってくるであろうデータをもとに、どんな研究ができそうかを検討します。その研究をするためにはデータをどうカテゴライズしてほしいかをデータエンジニアに伝え、それをデータエンジニアが反映していく流れになるでしょう。
もしかすると、研究に必要なデータを得るために、プロダクトチームに対して新しい機能やサービスを依頼するといったことも出てくるかもしれません。
 
現状は、プロダクト開発チームとデータサイエンスチームとの橋渡し役は私が担っていますが、今後入社される方にはそうした交通整理も是非担って欲しいと考えています。

「世界一のリサーチャーエクスペリエンス」を生み出せるチームを目指す

——新チームでは、データエンジニアにどういった考えを持って業務に取り組んでほしいと考えていますか?

データエンジニアのミッションは、研究者が研究するにあたって、「データ分析をする観点からデータとして課題がない状態」を作っておくことだと思っています。
 
データ分析基盤の構築や運用、保守をするうえでは、リハプランのデータだけでなく、公開されているパブリックデータを見つけにいかなければならないこともあるでしょう。また、プロダクトチームに研究者がどんなデータを欲しているか伝え、そのデータを集めるためのプロダクトデザインが必要であることを観点として与える必要が生じるかもしれません。
 
与えられたデータだけでなく、意味のあるデータを捕まえにいくために、どんなコミュニケーションを取れば研究者にとってよりよいデータ分析基盤になるかを日々考える。そして、ほかの部署や社外、もしかしたら海外にまで、積極的にデータを取りにいく攻めの姿勢でいてほしいですね。
 
また、DWHを作るうえでは、データガバナンスを効かせるような行動を取ってほしいと考えています。データ基盤を構築するうえで課題となるのが、データに対する意味づけです。たとえば「利用者」という言葉に対するデータの持ち方は、人によって異なります。

Aさんにとっては「過去にリハプランに登録されたすべての利用者」なのが、Bさんにとっては「リハプランで現在アクティブになっている利用者」かもしれない。こうした意味づけの違いによって、同じ研究をしたときにデータがズレてしまいます。

ですから、データエンジニアとデータサイエンスグループとですり合わせをして、Rehab for JAPANの組織としてデータの定義を決めておくといった動きが必要となるでしょう。
 
今後はBIツールを活用して、研究をスピードアップしたり、経営判断や新たなプロダクトを開発するうえでの統計データも整備できたらと思っています。また、データの格納場所や構造についてドキュメント化して、業務効率を上げていきたいですね。

——MLOpsエンジニアにはどういったことを期待していますか?

MLOpsエンジニアのミッションは、データサイエンスグループの人たちが「アルゴリズムを作って社会実装していくうえで課題がない状態」を作ることです。基本的には、機械学習基盤の構築・運用・保守をすること。そして、機械学習したものを社会実装していくためのパイプラインを構築します。

実際のアルゴリズム開発フローとしては、データサイエンスグループとプロダクト開発チームの真ん中に立つのがMLOpsエンジニアであるというイメージです。

データサイエンスグループの研究者がどんなアルゴリズムを実装するか検討し、形ができた状態で、MLOpsエンジニアはCI/CDツールを使って自動的にデプロイします。そのうえで、そのアルゴリズムが持つ特性をプロダクト開発チームにフィードバックします。

MLOpsエンジニアからのフィードバックをもとに、プロダクト開発チームではこのアルゴリズムをどこに当てはめて、どんなデータを与えるか、そのためにどんなプロダクトデザインにするかを検討して、プロダクト化を進めていきます。

実際にプロダクトをリリースしてアルゴリズムが使われ始めると、品質のモニタリングが必要になります。アルゴリズムを作っている段階でのデータと、運用段階でのデータでは傾向が異なってくるためです。

データの変化を早めに察知することで、アルゴリズムをもう一度学習させて、より強いアルゴリズムにしていく必要があります。自動的に再学習させる仕組み(CT:Continuous Training)を作り、単純にデータを増やすことで対応することもできることもあるでしょう。ただ、単純な再学習では精度向上が見込められない場合は、研究者とコミュニケーションをとり、新たなアルゴリズム開発を行い、そうして改善したものをもう一度リリースする。そうしたサイクルを構築して、回していきます。

データサイエンスグループによって作られたアルゴリズムと、プロダクトチームによる社会実装。両者の橋渡しを、MLOpsエンジニアに担っていただきたいですね。

——データ活用のために、開発組織としてどのようなチームにしたいと考えていますか? 

データエンジニアとMLOpsエンジニアにとっての第一の「お客様」は、データサイエンスグループです。データサイエンスグループのメンバーがより研究しやすい環境を作るために、世界一のリサーチャーエクスペリエンスを生み出せるチームでありたいと考えています。

データを分析して社会実装する過程で、いかにストレスをなくし、研究者の方々が最大の価値を提供できる環境を作れるか。決して受け身ではなく、データサイエンスグループという「お客様」に対して価値あるデータ分析基盤というサービスが提供できているかを常に考え、行動してほしいと思います。

新チームでは、「健康寿命の延伸を1秒でも早く実現するためのデータ分析基盤を構築・運用する。」というミッションを掲げています。敢えて「1秒でも早く」という文言を入れたのは、「いつか実現する」ではなく、「明日にでも実現する」にはどうしたらいいか考え続けてほしいという思いの表れです。

1秒でも早く目標を実現するために、次にどんな手段をとればいいかを常に考えてハックし続ける。このミッションがそうした思考のトリガーになるといいですね。

データ分析の領域でリーダーシップを発揮しながらチャレンジできる環境がある

——新チームの現在の課題を教えてください。

データエンジニアに関しては、セキュリティに関する課題があります。私たちが扱うデータは要配慮個人情報という大変機微なものなので、誰が、どのデータにアクセスできるか、データアクセスポリシーを策定する必要があります。

その上で、仮名加工情報の作成フローを整理したいと考えています。個人情報保護法では、個人情報は利用目的に即した使い方のみしかできませんが、仮名加工情報を使うことによって利用目的の幅を広げられます。

我々としては仮名加工情報をうまく使って、より幅広く研究をしていきたいと考えているため、情報システムチームと相談しながらどういった加工の方法があるか、個人情報保護法の観点をもとに検討していきたいですね。

もう1つ、データクレンジングの問題もあります。データを収集する過程で集まった、入力間違いなどによる不要なデータを排除して、本当に必要なデータの形を作りたいと考えています。

MLOpsエンジニアに関しては、データサイエンスグループにとってどんな形にすればデータを解析してモデルを作りやすいのかをキャッチして、そのうえでパイプラインを設計することが求められます。その後、パイプライン構築のロードマップを作り、実際に構築していく流れになると想定しています。

まずはデータサイエンスグループとコミュニケーションを取りながら、どんなパイプラインにすればいいかを探ることが直近の課題となるでしょう。

——いま、Rehab for JAPANにデータエンジニア、MLOpsエンジニアとして参画することで、どんなキャリア機会が得られるでしょうか。

データエンジニアに関しては、データ分析基盤をほぼゼロから構築する経験が積めます。MLOpsエンジニアについてはこれから立ち上がっていくので、本当のゼロイチの構築を経験できますね。

いずれも非常に裁量高く、リーダーとしての動きが求められるでしょう。今後どんなことをしていきたいかの立案から、どんなロードマップを描くかまで、自身で考えて動いていただくことになります。もちろん、私もサポートします。

新しいメンバーが「こんなチームにしたい」という構想を持っているのであれば主体的に動いていただいて、私はそこをサポートしていくという体制が取れたら理想的ですね。

今後CDPを構築するにあたってメインのポジションになりますので、いろんな部署とのコミュニケーションが必要になりますし、経営陣に対してもどんなデータ分析基盤を作ろうとしているか、共有する場面も増えてくるでしょう。そういった動きをしたいと考えている方にとっては、おもしろい環境ではないかと思います。

新チームは、当初は私の直下のチームとしてスタートしますが、最終的には1つの部にしていきたいと考えています。将来的に、部を統括するようなキャリアプランであったり、CDO(Chief Data Officer)のポジションであったりといったキャリアパスを描けますね。データ分析基盤の分野で駆け上がっていきたいと考えている人にとって、チャレンジができる環境です。

今後はデータ分析基盤の構築と並行して、Rehabに入ったエンジニアがエンジニアらしく幸せに働ける環境を創っていきたいと思っています。そうした思いを持って一緒に組織づくりをしていける方も歓迎します。

Rehab for JAPANでは、「健康寿命の延伸」を実現するために、各部署のメンバーが日々、同じ思いのもとで業務に取り組んでいます。「本当にいいものを作りたい」「世の中をよくしていきたい」という思いを持ったメンバーと一緒に、介護の現場をよくしていきましょう。

株式会社Rehab for JAPANでは一緒に働く仲間を募集しています
データエンジニア
MLOpsエンジニア


みんなにも読んでほしいですか?

オススメした記事はフォロワーのタイムラインに表示されます!

最後まで読んでいただいてありがとうございます!Rehab for JAPANの最新情報は、X(Twitter)でも発信しています。ぜひフォローしてください!