Elaboration in, Garbage out

Twitt*r ではメモできない何かそれ的なモノ・コトを

さっきのサイトを見つつ気になったことをメモ

※さっき

食べログに似たサイト - Elaboration in, Garbage out
※さっき終わり

イギリスにおける著作権と統計解析

イギリスで著作権を含めいろいろなんか動いているらしい(適当),

第310回:イギリスの著作権法改正案(私的複製の拡充、パロディのための権利制限の創設など): 無名の一知財政策ウォッチャーの独言

で,研究図書館関連では,次のような改正があるらしい.

The Copyright and Rights in Performances (Research, Education, Libraries and Archives) Regulations 2014

で,本題.ドラフト段階ではあるが,日本で言う「電子計算機による統計解析」に相当する部分が追記されるらしい.

(2) After section 29 insert—

“29A Copies for text and data analysis for non-commercial research

(1) The making of a copy of a work by a person who has lawful access to the work does not infringe copyright in the work provided that—

(a)the copy is made in order that a person who has lawful access to the work may carry out a computational analysis of anything recorded in the work for the sole purpose of research for a non-commercial purpose, and
(b)the copy is accompanied by a sufficient acknowledgement (unless this would be impossible for reasons of practicality or otherwise).

The Copyright and Rights in Performances (Research, Education, Libraries and Archives) Regulations 2014

斜め読み段階ではあるが,商用ではなければ割りと自由が効きそうだ.

日本における著作権と統計解析

例えばアマゾンのレビューデータを収集したとしよう.電子計算機を用いた統計解析のためだけに使うのならば著作権的に問題はない(著作権以外の問題はあるかもしれないが,とりあえず無いということにしておく).

で,いざという時に「俺統計解析のためだけに使ってるし!!!!1」という主張はどうやって行うのか,という点がびみょーらしく,どこかにデータ永続化する場合は,Bag of words 形式にしとくとか 3-gram model に使えるようにしとくとかいった統計的な処理をして保存しておいたほうが無難らしい.ふーん.