こんばんは。
マジで大したことはしてないですが備忘録として。
実現したいこと
TwitterAPIを使って自分のTwitterアカウントのフォロー、フォロワーのリストを作る。
理由はフォローが719人と多くなり、自分でも把握できなくなってきたため。
なお、Twitter公式からダウンロードできるログファイルの中にそれらのデータ(.jsファイル)も含まれている。しかしJavaScriptが全然分からないので今回は勉強も兼ねてAPIを使ってみる。(実際はJavaScriptが分からずとも適当に整形すれば使える)
方針
AWSで立てたlinuxサーバからpythonでAPIを定期的に叩く。ざっくり。
別に自分のWindows端末でも大きな問題はないが、スケジュールした時間にPCの電源が入っていなくて実行できないと面倒なのでサーバで実行したい。
ここまでで出来ていること
①PythonでTwitterAPIを叩いてフォロー、フォロワーのリスト(.jsonファイル)を取得する。
②APIの回数制限を超過した場合はリセット時間まで処理を一時停止し、リセット後再度APIを叩く。(一回のAPIで20人分しか取得できない)
③取得した複数のjsonファイルから必要なユーザ情報のみを抜き出して一つのjsonファイルにマージする。
④AWSのEC2でlinuxサーバを立てた。接続用のttlマクロも作成した。
⑤python3.6を④にインストールした。
書きながら思ったが③の抽出、マージは①で取得した時にやってもいいかもしれない。
このあとやること
①処理の関数化
現状雑に全処理をベタ書きしているので。
②jsonを上手くエクセルに取り込む方法の調査
基本的にはjsonの中身を上手く並び替えたりすればいい認識。
③定期的に実行することを踏まえた処理に変更
生成ファイル名に日付つけたり、ディレクトリ分けたりする必要がありそう。
普通に行き当たりばったりでやってるのでまだまだやらなきゃいけないこと出てくるはず。
週末くらいしかやる時間ないので時間はかかる。
シャニマスやらなきゃなので寝ます。
破壊