Monthly Archive for May, 2014

五月读书笔记

1、《枪炮、病菌与钢铁(Guns, Germs and Steel: The Fates of Human Societies)》,[美] 贾雷德·戴蒙德(Jared Diamond),上海译文出版社,2006-4-1

推荐指数:★★★★★

投资大神查理·芒格的推荐书籍列表中提及此书。芒格在1998年伯克希尔哈撒韦年会上的推荐理由是「… because Diamond is always asking WHY」。全书系统阐述了文明如何在亿万年时间内在各个大洲演进,彼此之间兼收并蓄或互相摧残,最后导致了现今世界发展不平衡的根源。地利相比天时似乎更重要,好的地理位置需要更充足的光照水分,继而孕育生命、产生资源、繁衍种族、传承文明。

一个之前未曾考虑过的问题是,为何欧亚大陆比非洲的文明更加进步?因为欧亚大陆大部分土地面积呈东西横向分布,同一纬度上的自然生态更趋于接近,因此无论是动植物的迁徙扩散或是文明成果的传播,都更为有利;而非洲大陆呈南北纵向分布,纬度的不同导致最好的情况是南橘北枳,最坏的情况是一处的进化成果根本无法为另一处所借鉴采用,虽处于同一大洲但南北部落各玩各的。连驯化和普及马都比欧洲耗费了更多时间,因此即便早早地发明了轮子,也根本进化不出马车。

这本书告诉我们,打游戏时要选择合适的降生点以及如何速攀科技树。(我最近正玩的 iOS 游戏 Plague Inc 里倒是可以恰如其分地实践本书的理论,比如病毒一上来就找中国这种地广人多的地方散布,甭管三七二十一先把空气和水一通污染)

2、《怪诞现象学(插图第6版) : 21世纪科学防骗指南》,[美]小西奥多·席克,世界图书出版公司·后浪出版公司,2014-2

推荐指数:★★★★★

出版社赠书。用科学的头脑武装大众,教民众如何辨别好的科学论断与怪力乱神的奇特现象。本书前半部类似《学会提问:批判性思维指南》,意在传授正确的思维方式、如何批判性思考、例举常见谬误;后半部则剖析了大脚怪、鬼、濒死体验、UFO这样的耸人听闻案例。这些究竟是人性的扭曲还是道德的沦丧?敬请阅读这本走近科学。

3、《我是猫》,[日]夏目漱石,上海译文出版社,2007-3

推荐指数:★★★★

选读这本纯粹因为我养了只猫,因此想交换身份从猫的艺术视角洞悉一番人类世界。本书文风带有一丝鲁迅式的针砭时弊横眉冷对+钱钟书式的玩世不恭游戏人间,大概夏目漱石与他们同处一个时代也不无关系。写到这里,我的猫正团成一团趴在阁楼上呼呼大睡。

4、《影舞者德川家康》,[日]原哲夫,台湾东立

推荐指数:★★★★

漫画,讲述日本战国时期著名的关原之战前德川家康被刺客暗杀,与他相貌言行几乎一模一样的影舞者二郎三郎继承其衣钵,继续扮演德川主公力求结束战争统一日本。画家原哲夫也是北斗神拳的作者,因此时不时冒出一张酷似健次郎的脸会让我略跳戏。喜欢日本战国历史的同学可以布卡上找来看看。

5、《德川家康决胜录》,[日]山冈庄八/[日]桑田忠亲,南海出版公司,2012-9

推荐指数:★★★

两个对德川家康各种八卦了如指掌的男人的对谈录,有助于对耳熟能详的史料产生更多层面的解读。

6、《奇特的一生》,[苏] 格拉宁,海燕出版社,2001-3

推荐指数:★★★

读这书纯粹因为看到一帮刚接触 GTD 概念的人嚷着柳比歇夫的时间手账做得真堪称楷模,将之捧入云端。全书最有共鸣的观点是:你花费在一件事物上时间的多少,应当反映出这件事物的价值。这个月来我司一帮同事都在炉石传说的打天梯竞赛中成绩斐然,更有甚者在本赛季成为传奇玩家。他们往往从下班回家一直奋战到次日凌晨。而我则始终徘徊在十四五级,成为被嘲弄对象。这对我来说根本不算事儿,因为我清楚地知道炉石传说根本不值得我这样耗费时间。

7、《Using Drupal》,Jeff Robbins 等,O’Reilly,2008

推荐指数:★★★

奥莱利的又一本 manual book,图文实例介绍 Drupal 的用法。关注 Drupal 是因为看中相比另一个开源的 CMS WordPress,Drupal 提供的一些模块似乎更易于搭建网店等功能性网站。读罢感觉 Drupal 总是在一些不那么重要(或者有更好的第三方实现途径)的地方做得比 WordPress 好,这诚然是个悲剧。(这一观点也在微博上受到了一位前 Drupal Contributor 的认同)

8、《图解HTTP》,[日]上野宣,于均良 译,人民邮电出版社,2014-4

推荐指数:★★★

一位我比较佩服的网友的译作。之前微博上有个百度 FEXer 发的热门技术帖,说这些年来最喜欢问的面试题是「从输入 URL 到页面加载完的过程中都发生了什么事情?」这本书就是答案。

9、《亲爱的界面 : 让用户乐于使用、爱不释手》,[瑞士] Lukas Mathis,人民邮电出版社出版,2012-11

推荐指数:★★★

又是一本人邮出版的行业入门书,适合-1到2岁的产品经理/设计师。

10、《猫力乱步》,猫力,湖南人民出版社,2013-9

推荐指数:★★★

恩我没事也看看游记。写印度被骗那段好有《JOJO奇妙冒险》的即视感。希望有一天也能带另一半环游世界。在那之前我的确有在认真学拍照。

11、《剑桥艺术史:绘画观赏(Looking at Pictures)》,[英] 苏珊·伍德福德(Susan Woodford),译林出版社,2009

推荐指数:★★

浮光掠影的看图说话,对任何一个时期/一个题材/一个作者/一种流派的讲述都言之未深,背下来当装逼的谈资都觉得拿不出手。

Growth Hacker 奇技淫巧一则:零授权,抓取新浪微博任何用户的微博内容

有时或基于以下凡此种种需求,我们会想要去抓取新浪微博的内容:

  • 产品冷启动,导入外部数据,而非从头积累;
  • 通过大数据+语义分析获取用户兴趣行为偏好,提供智能推荐;
  • 监控微博舆情,对特定关键词或是用户行为进行响应;etc

想必新浪深知微博内容本身是最其有价值的资产,一旦被竞争对手大批量抓取导入,则辛苦建立起的门槛将瞬间化作他人之嫁衣,因此做了非常繁复的安全保护,包括强制登录跳转认证、跨域检测、cookie 植入、禁止账号密码登录而启用 OAuth2.0 等等。

近期个人有一些抓取需求,在查询大量过时的网络资料测试无果后,决定另辟蹊径完成这一目标,并最终测试成功。在此分享出来。(这篇文章将提供解决问题的方法思路,但不会给出具体代码。伸手党请移步百度或 Github。)

你需要准备:一个个人微博账号,我们将透过它去访问其他用户页面,从而抓取。除此之外,别无所求。
Continue reading ‘Growth Hacker 奇技淫巧一则:零授权,抓取新浪微博任何用户的微博内容’