2009年07月10日

やっとattributeの取り方を理解する。

ほとんどの関数が名前か番号で指定なので
未知のフォーマットのXMLの場合はattributeの名前と位置が知りたい。
XML::LibXML::Readerではattributeの名前を取得できないみたいなのだが
LibXMLのDomの命令での取得方法のこつをようやくつかんだ。
それでどうした!......
posted by Xo_ox at 19:00| Comment(0) | perl | このブログの読者になる | 更新情報をチェックする

2009年07月09日

LibXMLでveohのflvのurlをパース

ブラウザのような一般的なクライアントでアクセスする場合
veohはyoutubeと違ってFLVのURLの書かれているファイルがちゃんとあるので
そこからflvを正規表現を使って取得する方法を今まで使っていたのだけれど
せっかくlibXMLを使ってhtmlまでパースするようになったのだから
ちゃんとXMLとしてデータ取得してみようと思った。
それでどうした!......
posted by Xo_ox at 19:00| Comment(0) | perl | このブログの読者になる | 更新情報をチェックする

2009年07月08日

XML::LibXMLでhtmlを取り込む

XML::LibXMLはXMLでないhtmlもパースできるようだ。
パースエラーがでるのが常だが「recover_silently(1)」を入れれば強引に取りこめるようだ。
utf-8の問題とか配列アクセスとかつくづくperlを分かっていないのだが
htmlパーサーへの入り口にたどり着いた感じがした。
それでどうした!......
posted by Xo_ox at 19:00| Comment(0) | perl | このブログの読者になる | 更新情報をチェックする

2009年07月07日

youtubeAPIの穴、ハルヒ最新公式動画にはたどり着けない。

ブラウザでもyoutubeAPIでリンク付きのページを表示できるのだが
角川アニメチャンネルで毎週更新される涼宮ハルヒの憂鬱の新作にはたどり着けないことが分かった。
トップページのmost_discussedとかmost_viewed とかでもでてこなかった。
何か策があるかもしれないけれどわからないがブラウザでは表示できるので
htmlからurlを出すしかないみたいのようだ。
それでどうした!......
posted by Xo_ox at 19:00| Comment(0) | perl | このブログの読者になる | 更新情報をチェックする

2009年07月06日

XML::LibXML::Readerがちょっと気に入った。

LibXMLで最初に検索したときに目についたのがTextReaderなるものだったのだが
取り敢えずDOM操作から入りたかったので後回しにしてみた。
タグ単位で処理していく他名前空間も明示的に扱うので
あまり階層が深くないものはこれで刈り込みながら
必要なところだけ取り込むのが良さそうだ。
それでどうした!......
posted by Xo_ox at 19:00| Comment(0) | perl | このブログの読者になる | 更新情報をチェックする

2009年07月05日

XML::LibXML::XPathContextも使ってみたが...

ルートのノードにxmlnsがかかれている場合全部ローカルネームとして処理することで
どうにか扱えるようになったのだが
ちゃんとした扱いもしてみたかったので「XML::LibXML::XPathContext」を使ってみたのだが
取得するのはdomでコンテキストはそのまま継承されないので
案外と使いにくいことを悟った。
但し単に方法が検索などでみつからなかっただけかもしれない。
それでどうした!......
posted by Xo_ox at 19:00| Comment(0) | perl | このブログの読者になる | 更新情報をチェックする

2009年07月04日

XML::libXMLでAtomのxmlnsでつまづく

libXMLを使う場合、単純なXMLはfindnodesやfindvalueでおっかけていくのだが
youtubeの検索結果を保存してちょっと表示させようかと思ったらなんもでない。

<feed>タグ内のxmlnsを空にしたら表示するので名前空間の問題らしい。
特に名前空間にこだわらない場合は
「findnodes("//*[local-name()='entry']")」のようにしてやると良いことが分かった。
それでどうした!......
posted by Xo_ox at 19:00| Comment(0) | perl | このブログの読者になる | 更新情報をチェックする

2009年07月03日

XML::LibXMLでperlのutf8モードとやらに翻弄される。

XML::Atomは使わないことにして、XML::LibXMLを入れて
ちょっとXMLを作ってテストしようと思ったら
なんか

Wide character in print at libxml01.pl line **

という警告メッセージがでる。
どうもperlの内部にはutf8モードなるものがあるらしい。
それでどうした!......
posted by Xo_ox at 19:00| Comment(0) | perl | このブログの読者になる | 更新情報をチェックする

2009年07月02日

youtubeアクセスへの手がかりを探す

youtubeの個別のファイルからmp4なりflvなりを取得する方法は
安定して使用できるようだが
動画プレーヤーを作る場合、その肝心の動画IDに至る部分がブラウザだよりになってしまう。
現時点でjavascriptフル実装のhtmlブラウザを作るとゴタゴタになってしまうので
シンプルなhtml解析かGoogle提供のAPIがあればそれを使いたいと思った。
最初に「youtube perl api」で検索したところdata apiを使えばいいらしいが
developer IDなるもの必須というオープンソースもプレーヤーには
あまり芳しくない使い辛い情報しかみつからなかったのだが

いろいろキーワードを変えた結果
http://code.google.com/intl/ja/apis/youtube/developers_guide_protocol.html
の「動画の取得と検索」に答えが全てあった。
それでどうした!......
posted by Xo_ox at 23:30| Comment(0) | 基本データ | このブログの読者になる | 更新情報をチェックする

2009年07月01日

youtubeダウンロードーをlaunchyからクリップボード対応に

perlによる
Flash playerがなくても快適に動画を見る道
というのの他にveohやダウンロードだけするものも作っていたのだが
firefoxからアドオンのlaunchyで呼び出すことが前提にしてあった。
それをクリップボード版にすることで汎用性を持たせることにした。
それでどうした!......
posted by Xo_ox at 23:20| Comment(0) | perl | このブログの読者になる | 更新情報をチェックする
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。