存档

2010年2月 的存档

nutch的分布式抓取

2010年2月12日 ahei 26 条评论

前段时间我写了一篇文章讲nutch的简单使用,是单台机器抓取,今天我讲一下nutch的分布式抓取。

由于nutch的分布式是采用hadoop,所以nutch的分布式抓取主要涉及到hadoop和nutch本身两方面的配置。 阅读全文…

ssh的免认证登录

2010年2月12日 ahei 9 条评论

linux下用ssh登录别的机器的时候,需要通过交互方式手工输入密码,ssh不支持直接加密码的选项,它觉得这样不安全。 但是有时候要完成一些自动的任务,比如登录到别的机器上,并在那台机器上启动一些程序,这时候该怎么办呢? 阅读全文…

分类: linux, 中级