InnoTrek

「Where innovation never stops.」

我站在比特之巅, 凝望着知识之渊

题记:徘徊在数字的世界里,我有时感觉像个富有的国王,有时又像是暗夜中前行的乞者。我时而站在比特之巅,笑傲群山;时而被逼仄无路,如临深渊… 经过三十多年数字化技术的高速发展,人类积累了巨量的比特数据。如果这句话听起来那么平庸,下面的统计数据会让你有更直观的感受: 2020年人均每秒产生1.7MB数据,每天人类产生2.5EB (1EB=10^9GB) 截至2020年底,整个数字世界...

Ubuntu 18.04安装CNDeepdive

Deepdive是斯坦福前几年开发的知识特征提取引擎,不过项目目前已经进入维护状态。最近由于研究项目需要,准备基于CNDeepdive对中文进行知识抽取。 虽然官方最新支持到Ubuntu 16.04,而自己的系统是18.04,加之不愿折腾新系统,一个周末都在趟坑,不过尚好走通了,记录下来以飨来者。 首先,CNDeepdive可以从OpenKG.cn或百度云盘下载。由于自动化安装基于d...

新「拿来主义」

和鲁迅先生八十年前谈论的“拿来主义”不同,这么多年过去了,时过境迁,我们早已习惯了这种“拿来”的方式。在这个意义下,鲁迅先生应该欣慰才是。商品外形设计、电影创意、甚至汽车尾灯的颜色,都被我们一一拿来,有的偷偷地放在自家的东西中,脸皮稍微厚点的甚至会借着观众的无知,自诩为“民族产业”、“自我创新”。时间久了,甚至连自己都被说服,相信某个灵感真的是自我孕育、厚积薄发的产物。 推心而论,中国...

Process Gis Shapefile With Graph Tools

When processing GIS data, we sometimes need to analyze object movement on the map. For example, given some data records of bicycle riders lending and returning bikes (aka OD data), a shortest path ...

14 Must-Read Books For Behavior Data Scientists

In my Ph.D career, human behavior (especially mobility) analysis from telecommunication data is my studying theme. I learned a bunch of theories and techniques from other domains when they are of ...

A Tutorial On Topology Correction Of Shapefiles

Abstract: Here is some practical expeirience in cleansing the shapefile using GRASS, which is an open-source platform to do scientific analysis on spatial data. ERIS shapefile is a popular format ...

常用R工具包合集

R在统计分析、机器学习、以及绘图上有着丰富的功能,基础安装包里的函数能够满足基本的需求,如果需要更多样化、复杂的数据处理,可以试着使用以下工具: 数据清洗转换 (Data wangling) DescTools (Tools for describing data and descriptive statistics) dplyr (面向data.frame,plyr的下次迭代...

Top Tricks to Make Your Zotero More Powerful

Zotero is a free, easy-to-use tool to help you collect, organize, cite, and share your research sources. It support a wide range of documentation types from papers to presentations, from web pages ...