機械学習エンジニアってなんだろう?

お久しぶりです!EMです^^

 

2月も半分が過ぎてしまいました。早いですね~。

私が住んでいるトロント市は現在ロックダウンしており

その上今週から非常事態宣言も発表されて、ますますコロナの厳戒態勢が

強まっていました。

ただ、周辺の地域はロックダウンが解除されつつあるのと
ワクチンも少しずつ普及しているみたいなので

どんどん状況が改善されるといいですね。

 

さてさっそくですが本題です!

 

 

今回は他の人がどの様にして、機械学習エンジニアとして

実際どんな事をしているのか、海外の記事を参考にしながら

読み解いていきたいと思います。

国によってはエンジニアの仕事も様々だと思うので、日本やそれぞれの会社によっては

全く同じことがいえるかどうかは分かりませんが、参考程度にぜひ読んでみて下さい!

 

今回はこちらの記事を参考にしているので、英語の勉強がてら

併せて見てみて下さいね。(本記事は下の記事の一部を取り上げています。)

How to become a Machine Learning Engineer in 2020 | by Jeffrey Luppes | Towards Data Science

 

さっそく悲報ですが、私がたまにカナダの求人を眺めていても

あまりMachine learning engineerとして、機械学習エンジニアの超エキスパートを

求めている企業はあまりない、という印象があります。

多いのはdata scientistやsoftware engineerの求人で高ポイントになる1つのスキルとして

ML(機械学習)が使えれば尚好し!みたいな位置づけをされている事が多いです。

 

そんな中で、下の表は一般的なMLエンジニアが行っている一連の流れです。

生のデータから実際に使えるデータとして加工される内容を

ざっくり表しています。

 

真ん中の小さな黒い四角が見えますか?

四角の大きさが、全体の流れの割合も表しているのでしょう。

MLエンジニアは毎日毎時間、MLのコードを書いて、モデルやアルゴリズムを試行錯誤している訳ではなさそうです。実際は仕事の5~10%の割合みたいですね。

 

Image for post

 “Hidden Technical Debt in Machine Learning Systems” by Scully et al. (2015)

 

さらに、MLエンジニアとは一体どんな事をしているのか?という定義がこちらです

…A person called a machine learning engineer asserts that all production tasks are working properly in terms of actual execution and scheduling, abuses machine learning libraries to their extremes, often adding new functionalities. (They) ensure that data science code is maintainable, scalable and debuggable, automating and abstracting away different repeatable routines that are present in most machine learning tasks. They bring the best software development practices to the data science team and help them speed up their work…

— Tomasz Dudek in But what is this “machine learning engineer” actually doing?

 

google先生の直訳は下記です。

…機械学習エンジニアと呼ばれる人は、すべての本番タスクが実際の実行とスケジューリングに関して適切に機能していると主張し、機械学習ライブラリを極限まで悪用し、多くの場合、新しい機能を追加します。 (彼らは)データサイエンスコードが保守可能、スケーラブル、デバッグ可能であることを保証し、ほとんどの機械学習タスクに存在するさまざまな反復可能なルーチンを自動化して抽象化します。 彼らは最高のソフトウェア開発プラクティスをデータサイエンスチームにもたらし、彼らの仕事をスピードアップするのを助けます…

 

 要は、MLエンジニアはデータサイエンティスト達のモデルを改善して

より良い精度かつスピードアップを図っていく事が、一般的な位置づけの様です。

 

先日のThe Social Dilemmaの映画の内容でもありましたが

特にビックデータを扱っている大企業は、ディープラーニングや

リコメンダ―システムを駆使していて、顧客の興味をひいているので

MLエンジニアがデータサイエンティストや企業そのものを根底からサポートしている

と言っても過言ではないような気がします。

 

今後はますますビックデータを扱いたい企業や団体が出てくると思うので
MLエンジニアの需要も増えていきそうですね。

 

 

 

ちなみに、今後MLエンジニアやデータサイエンスを通じて
転職やキャリアップを考えている方にぜひ検討してみてほしいのがこちらです!

 

 ↓↓データミックス

 

かなり口コミもよさげで、講師陣も現役バリバリの人ばかりみたいです。

 

気になる方は、このデータミックスが提供しているコースの
メリットデメリット等も解説してみたので、併せてこの記事も参考にしてみてください^^

 ↓↓

machinelearningforbeginner.hatenablog.com

 

 

 

それでは今回はここまでです。

最後まで読んで頂きありがとうございました!