Nutch 的初步配置可先参考这个link
http://peigang.iteye.com/blog/1682107
遇到几个在window上无法run的问题,在这里纪录一下
1. 按照杨尚川的视频9. 先对hadoop-1.0.3下载原码,然后修改thow exception变成LOG.Warn及autoreconf 的问题解决后。编译完成hadoop-1.0.3后,把它更新到ivy的reposity中。
2. 在运行parschecker中,遇到
Exception in thread "main" java.lang.RuntimeException: x-point org.apache.nutch.protocol.Protocol not found.
是因为在nutch-default.xml中没有指定正确的plugin.folder,所以无法找到plugin的类。这个可以在hadoop.log找到没有load plugin
3. 最后出现urlnormalizer-regex 这个类没找到。原因是因为java Build Path的source中没有把urlnormalizer-regex加进去。后把urlnormalizer-regex 下的java, test目录加进去。就一切正常的
相关推荐
eclipse配置nutch,eclipse配置nutch
1.1 环境准备 1.1.1 本期引言 1.1.2 环境介绍 1.1.3 JDK 安装配置 1.1.4 ANT 安装配置 1.1.5 IvyDE 安装配置 1.1.5 Tomcat 安装配置 ...1.2 Eclipse 开发 1.2.1 Solr 部署 1.2.2 Nutch 导入 1.2.3 Solr 与Nutch 结合
nutch 在windows下环境搭配 已经如何在eclipse下配置,有配图,很详细
Nutch在windows开发中程序运行环境的配置,可用于Java环境开发
Windows下使用Eclipse配置Nutch2图文详解
Eclipse 编译 Nutch-0.9
Eclipse 中编译 Nutch-1.0 运行源代码
我自己对nutch安装开发环境的一些理解,以及遇到问题的解决方法
apache-nutch-2.2.1(Eclipse直接运行版)今天刚做的,发现有很多坑,分享给大家实验,JDK1.7 Win10。我分享的两个压缩卷一起下载才可以用,资源限制太小了 002地址:...
一步一步详细解释了如何搭建nutch web开发环境,对nutch1.2有效,nutch1.3以上已经没有web这部分内容了
Nutch2.3.1 环境搭建 Nutch2.3.1 环境搭建 Nutch2.3.1 环境搭建 亲测可用,我自己安装和搭建过程的记录文档
Nutch1.6的编译配置过程,详细介绍了Nutch1.6的下载到安装运行过程。
nutch 1.4 在windows下安装配置
Nutch1[1].4_windows下eclipse配置图文详解
Nutch的配置文件主要有三类: 1.Hadoop的配置文件,Hadoop-default.xml和Hadoop-site.xml。...3.Nutch的插件的配置文件,这些插件的配置文件在加载插件的时候由插件自行加载,如filter的配置文件。
详细介绍nutch在windows下myeclipse中的配置以及执行,本人空间还有nutch1.2包,nwgwin安装包等
nutch1.4 在windows下的安装配置环境搭建
本文章修改了在eclipse中加入Nutch的详细过程!
配置好的Nutch1.3开发环境,解压后直接导入Eclipse Workspace即可,调试通过,默认爬163两层,解决Eclipse3.6+版本无基于源码创建工程选项问题
Eclipse中编译Nutch-1.0。。。。。。。。。。。。