まっしゅあっぷごっこ

  1. 最上の日々を購読しようとするもfeedは無し。
  2. なんでもRSSで…
    → 『 日付情報が見つかりませんでした.』
  3. Dapperを試す。
    → 文字化け。
  4. Pipesを試す。
    → やはり文字化け。
  5. 対処法を適当にぐぐる
    UTF-8でないとヘッダにcharsetがないとダメらしい。*1
  6. なんとかしてくれそうなサービスを探す。
    → 無さそう。*2
  7. 変換するだけなら簡単なはずと考えGAEで自作することに。
    → 設定面で紆余曲折あるがなんとかなる
class WebIConv(webapp.RequestHandler):
  def get(self):
    import urllib2
    url = self.request.get('url', 'http://miscapis.appspot.com')
    csf = self.request.get('from', '')
    cst = self.request.get('to', '')
    res = urllib2.urlopen(url)
    body = res.read()
    head = res.info()
    if(body[0:3] == '\xef\xbb\xbf'): body = body[3:] # nuking BOM
    mime = str((head['content-type'] or 'text/html') +'; charset='+ cst)
    self.response.headers.add_header('Content-Type', mime)
    self.response.out.write(body.decode(csf).encode(cst))

でけた。いやはやひどい遠回りである。

+

同じ要領で雑記帖のも作った。

++

役に立ったようで良かった。

*1:つまりmetaタグの解釈とかしない

*2:たぶん探すのが下手なだけ