Tag : Ruby

Web上から画像を収集(スクレイピング)するスクリプトを書いた

投稿日: 2018年8月13日

機械学習などで画像を収集したいことがある。 学習用の画像は、買ったり、自分で撮影したり、公開されているデータセットを使ったり、インターネットから拾ってきたり、と様々な方法で入手可能である。 今回はインターネットから画像を拾ってくるスクリプトを書いたのでそれの記録を残す。 なお、ここで示すのスクリプトや規約は記事投稿時点での内容となっている。そこからWebサイトの仕様や規約が変わっていなければそのまま使えるはずである。(仕様は結構変わるのでその都度変更が必要になる。) 概要 画像検索サービスにはGoogle, Bing, Twitterなど様々なものがあるが、規約的にだめだったり、検索ページがJ…(続く)

RubyでのGTK3+開発のTips

投稿日: 2018年7月30日

RubyでちょっとしたGUIのプログラムを書くとき、GTK3+を使うのは非常に便利である。 調べて大変だったTipsをメモがてらここに記録を残しておく。 ボタンにAltキーのショートカットをつける Altを押すと下線が引かれたキーでボタンが押せるあれです。 Altアクセスキーとも呼ばれるらしい。

ボタンのlabelにアンダーバー(_)とアルファベットを続けて書いてset_use_underline(true)をするとそのアルファベットがショートカットキーになる。 上のコードでは’O’キーを割り当てているが…(続く)

Nokogiriを使ってWebページから情報を取得する

投稿日: 2018年7月22日

RubyのNokogiri(gem)を使って特定のWebページから特定の情報を抜き出す。 今回は乃木坂46公式サイトから本日のテレビとラジオとWEBの出演情報を取得する例を書く。 具体的にはトップページの下の図の赤い枠で囲ったスケジュールのWEB, RADIO, TVと書かれた情報を抜き出して表示する(青い枠で囲った部分にも同じようにメティア出演情報が載っており、どちらでもよいが今回は赤い枠の方を抜き出す)。 準備 まずはgem install nokogiriでNokogiriをインストール。 次に抜き出す情報のCSSのクラス名を調べる。 ブラウザのWeb開発ツールを用いるのが簡単である。 …(続く)

[Ruby] open-uriでのプロキシやユーザーエージェント(UA)の設定方法

投稿日: 2018年7月18日

Rubyのgem「open-uri」でプロキシ(proxy)やユーザーエージェント(user-agent: UA)の設定をしてhttpにアクセスしたいときの使い方のメモ。 プロキシを設定する URI::readやopenを使う場合は、proxyキーワード引数にプロキシサーバーのURIを渡す。 プロキシサーバーURIは「http://[user_name]:[password]@[address]:[port]」の形式で記述する。 例えば、プロキシサーバーのaddressがhttp://proxy.hoge, ユーザー名がfuga, パスワードがbarでポートが8080の場合は「http://f…(続く)

GTK+で強制的に画面(ウィジェット/ウィンドウ)を更新する

投稿日: 2017年11月30日

GTK+を用いて簡単なGUIアプリケーションを開発する時、毎回忘れてしまうのでメモ。 重い処理をさせながらプログレスバーやラベルなどのウィジェットを更新したい時、スレッドを立ててUIスレッドがビジーにならないようにすることが多いが、どうしてもメインスレッドで更新したい時がある。 そんな時、Tcl/TkではTk::updateを用いるがGTK+ではgtk_main_iteration()を用いる。RubyではGtk::main_iteration, Pythonではgtk.main_iteratiom()である。 これを更新したいタイミングで呼び出すことで、強制的にウィンドウ(ウィジット)を更新…(続く)

PyCallを用いてTensorFlowをRubyで使う

投稿日: 2017年11月10日

PyCallはmrknさんが開発しているPythonのライブラリをRubyで使うgemである。 バージョンが1.0になって大幅に使いやすくなった。 今回は、このPyCallを用いてPython用のライブラリのTensorFlowをRubyで動かしてみる。 今回の環境はWindows10, Ruby2.4, Python3.6を用いた。 PyCallのインストール PyCallを使用するにはPythonをインストールする必要がある。(すでにインストール済みの場合は必要ない) インストール方法はなんでも良いが、公式のWebページのダウンロードリンクからインストーラーをダウンロードしてインストールす…(続く)