一年前我读了一本书叫做《China .Inc 》,作者是个美国新闻界的老油条,Ted.C Fishman ,中文名字起的很有意思“费晓闻”,书读下来之后第一印象是,这小子怎么知道这么多事,例子信手拈来,仅仅是一本畅销书书后的参考目录竟然有二三百篇文献,有的来自互联网,有的来自报纸,还有的是书目。这一方面与费晓闻同志多年努力、在业界的“晓”“闻”分不开,另一方面在这背后他一定有着一套自己的资料管理系统,否则这么繁杂有价值的例子和故事是不可能用大脑储存抑或短时间google攒出来的。
也是从去年,我开始在美国留学读研究生,大量的书目、paper、课堂笔记、新闻,开始涌入我的学习生活,有时候突然有一个不明白的专业问题想查查资料却由于资料不在手边或者忘了放哪儿而只好放弃,或者过去曾看到一篇好的网页文章或图片,但是现在那篇文章被删掉了,错失了很多机会。有的同学可能会说了,google呀,其实真正在专业领域的研究google还是有局限的,它常常返回一些不搭界的结果或者肤浅的介绍,当然google那些程序员们也意识到了这个问题,也试图让搜索结果更有针对性 。在入门级和基础知识方面,wikipedia 比较好用,但是也不是完美,有的词条也提供不了你需要的内容。另外有些资料是属于自己的,比如课堂笔记,比如自己平常搜集的资料(互联网上找不到的),这些东西google可帮不了忙。解决办法还是建立一套自己的资料库。
我们需要什么样的资料库。
资料库的目的就是为了方便自己保存任何对自己有价值的资料,并能非常方便的检索。我希望自己有一套这样的系统能把资料就装在优盘里,接上电脑就能搜索,而且还比较容易备份,当然还要安全。如果再仔细考虑的话,剩下的问题就是,资料以什么形式储存,doc还是pdf,中英文混和起来存还是分开(涉及到文字的特性和检索算法);通用性如何,比如万一以后微软倒闭了,doc文件怎么办。建立的那些索引文件能不能很好的转换格式;检索(index)达到什么深度,文件里的内容做不做索引;使用网络储存还是本地储存;如何保证安全性,数据库不被人侵入,丢了电脑的话不至于造成额外损失……当然可能还有很多。这些标准可以评价一个资料管理系统的好坏。
经过一段时间的观察,我目前发现的资料库管理有(欢迎各位补充),古道视野的Google desktop资料管理系统 ,Onenote 或Evernote 。这些方法各有好坏,以我个人经验做一些评价,Google desktop采用google的搜索引擎技术,对文件也是采取建立索引的办法,但是它是对整个电脑进行编目(待求证及深入研究);Onenote和免费版本的Evernote的好处是以notebook的形式存文件,可以录音和粘其他格式文件,另外附带OCR技术(后面会讲到),还有语音识别和检索(待求证),同时具有很好的搜索功能。这两种办法的共性都是依赖商业软件,以及本地储存。
原先想发扬科研精神,写一篇文章仔细比较一下诸如google desktop,onenote等等,后来觉得太扯淡了。今天趁着心情还不错,把有点意思的玩意赶紧讲了吧。与其说推荐firefox插件还不如说是探讨一种资料管理的方法。
要实现什么:
* 如果你有很多课程资料,paper,笔记,图片,甚至网页,而且最好都是英文,想放到一起收藏 ,也就是做你的个人资料库。能够几秒钟就能收藏一篇 。
* 如果当你想起点什么需要查一查的时候,你想能很容易地检索 这些文档的内容,并在几秒钟之内就能打开看 。
* 如果你想对你的文档方便地进行批注
* 如果你想很容易地备份保存 这些资料,安全可靠。
那么你可以试试,否则的话就不用看了。
工具:
Zotero 1.5 + Acrobat
其实这篇文章我主要就是想讲讲Zotero,链接 ,用了快两个月,总体上讲还算不错而且免费,尽管也有点问题。如果你知道Endnote,那Zotero就不难理解了,据说Zotero是开发人员把 endnote反向工程弄出来的,好像还和Thomson Reuters闹了点别扭 。反正……不管他啦,Endnote我没仔细研究过,如果某位仁兄觉得Endnote或别的软件也能实现本文的类似思想,用别的也没问题。
Zotero 1.5
我的想法就是把zotero当成资料库管理软件,因为它有几个比较牛叉的特性:
* 文献识别,能直接从google scholar,IEEE Xplorer网页结果中抓取 并编目(这个研究生有用)
* 直接嵌入bibliography到word,Latex (研究生用)
* attachment功能,能在任何文档条目中附上附件,并能对pdf文件全文index ,从而提供全文检索 功能。
* 方便的分类搜索 ,标题,作者,tag,附件内容等等。
* 方便的note和tag ,对某文档有什么感想或灵感,赶紧记下来。
* “云”,可以把所有资料同步 到你的WebDAV网络空间,把所有条目同步到Zotero网站你账户下的library,存到网络空间上的资料都加了密。UW的朋友可以同步到你的1G的mywebspace。
* 方便备份 ,由于attachment可以用store copy of file来添加文件,从而能让你的文档放到一起,这样只要把该文件夹复制一下就行了,如果电脑出现问题,把文件夹恢复,然后从zotero的 library restore一下就能完全恢复本地资料库。
* 方便携带 ,由于firefox portable 可以直接装在优盘里,也支持zotero插件,这就意味着你可以随身带 着你的资料库 。
zotero把文件放入资料库的过程基本上是这样
建立条目Document-->
编辑info(如果是直接从网页上抓取的文献就不必了)-->
attachment:store copy of file-->
add note(tag):写点心得-->
sync(如果你想同步到你的网络空间以及zotero library下)
Acrobat
起到的作用就是对文档进行处理 ,辅助Zotero的搜索功能。
1 Acrobat最牛的功能应该是OCR (optical character recognition),说白了就是能把你扫描 的文件(非手写体)识别 转换成能提取文字的pdf文档,从而能够全文搜索。
2 Acrobat的评注也很好用。不动笔墨不读书,就像编程写comment,让你能马上知道你原来是怎么想的,评注能提高学习效率 。
缺点与弥补:
由于Zotero是佛吉尼亚一个小地方的小大学的一帮小美国佬搞的,所以软件功能只对英文比较完善。中文的Index编码不对,因为搜中文能搜出一些不相干的英文资料,而且对中文也不支持中文分词 。尤其收藏一些中文网页更是造成混乱,污染了搜索功能。这个缺点足以让很多中国人放弃zotero。
所以弥补的办法是另一个firefox插件,但只限于保存网页。
ScrapBook
日本人开发的
1 能支持中文的Index和分词
2 方便强大的搜索功能
另外Zotero的Sync(同步功能)还不是很完善,两台电脑和资料库同步的时候,会重复上载并覆盖attachment。
希望本文对各位朋友有所帮助。
(作者:rub.zyc at gmail.com) |