irisuinwl’s diary

サークル不思議(略)入巣次元の、数学や技術的なことを書きます。

~しょばふぇすで遊ぶデータ分析~ ソシャゲのガチャスクショを画像処理してアイテム出現確率を推定した

タイトルの通り

 

最近ショバフェスにハマっております。

スクショを取りまくっていたのですが、これでなんか遊べないかなと思って、ガチャイベ(いっぱいガチャを回してゲームの便利なアイテムを取得するイベント)でガチャからアイテムが出る確率を推定してみました。(Computer Visionの勉強もしているので、それでもなんかやりたかった)

 

一段落付いたのでcolabに纏めて公開しようと思います。

※画像は引用という形で加工して一部分しか出してませんが、著作権的に問題があったら消します。

 

colab.research.google.com

 

具体的にやったことは以下です。

1. ガチャスクショ画像からガチャアイテム画像の抽出(crop)

2. アイテム画像をヒストグラムで特徴化し、類似度でクラスタリングして特徴空間がどんなものかみる

3. kNNが有効そうだと仮説を立てて、データをラベリングし、kNNで交差検証し、ちゃんと判定できることを確認(まあ、固定画像なんだからそらそうかって感じだけど)

4. 今まで貯めたスクショ画像について3. で作ったモデルを用いてラベリング→確率モデリングをして、確率の推定を行う。

 

想定知識は以下です。