AIが止まらない!
この記事はギークハウス Advent Calendar 2017の6日目の記事です。ギークハウス新宿1に住んでいた山下と申します。最初に、サークラの記事を期待してた人ゴメンなさい!あとPCの方が見やすい仕様になってます。仕様です。
今年も終わりが近づいてきました。2017年はトランプが大統領になったり、将棋の藤井四段が公式戦29連勝したり、けものフレンズにIQを溶かす人が続出したりする年でした。
人工知能が身近になった年でもありました。Deep Learningの登場により第3次人工知能ブームとなった影響なのか、私の周りでも機械学習をやってる人がちらほらいます。
Google Trends キーワード: 人工知能、ここ2-3年間の推移
11月に転職をして、データサイエンティスト見習いになったので気づいたことを共有しようと思います。
Jupyter Notebookの呼び方には2通りある。
ジュピター派とジュパイター派がいます。JavaScriptのJS派とジャバスク派みたいなものです。
そもそもJupyter Notebookとは、
Notebookはブラウザで動作するプログラムの対話型実行環境です。 ノートブックと呼ばれるドキュメントを作成し、プログラムの記述と実行、メモの作成、保存と共有などをブラウザ上で行うことができます。
R言語もめっちゃ使われてる
統計解析に便利です。普通に使われてるので、なんでPythonじゃないの?と煽るのはやめましょう。
統計は重要
統計もよく使います
Deep Learningを使う場面は多くない
ビックデータを集めるの大変だし、クライアントに説明しづらいし。基本的な統計解析して、従来の機械学習モデル使ってダメそうなら検討する感じらしいです。
※ ただし人による
Pandas便利
PandasとはPythonのデータ分析ライブラリの1つで、大きな表データ、行列を扱うことができます。Excelでやる表計算とかデータの前処理とか初歩的な統計処理とか、あとは簡単な描画もPandasでOK
データサイエンティストってやること多い
分析結果を伝える時にパワポ作ってプレゼンしたり、データ読み解くために業界の知識が必要になったり、もちろん機械学習も統計もデータの前処理もするので色々やることあります。
データサイエンス楽しい
データの概要を理解するために図を描画するとデータ分析やってる感あって楽しいし、データ収集するためにクローラー作って数日苦戦してるとダメな子ほどかわいい的な親心が芽生えて楽しいし、機械学習してちゃんと学習してくれるのを見るのも楽しいです。
きっかけ
データサイエンティストになったきっかけは、ギークハウスで出会った強いITエンジニア達の存在でした。
私もIT業界に飛び込んだときはフルスタックなエンジニアを目指してました。しかしながら強いエンジニアを尊敬する一方で、この人達に追いつくの大変だなーと思ってました。
一説には日本のITエンジニア人口は80万人程度だそうです。80万人のレースに参加するのツラいなあ。出来ることならディズニーランドのファストパス的なショートカットを通りたい。よし、有利なポジション(立ち位置)で殴っていこう!とデータサイエンティスト見習いになりました。
データ分析のご依頼がございましたら、下記までご連絡いただけると幸いです。
y2.yamashita@datumstudio.jp