海量文件的分布式计算处理方案

学历类| 阳光高考　研究生　自学考试　成人高考　专升本　中考会考 外语类| 四六级　职称英语　商务英语　公共英语　日语能力

资格类| 公务员　报关员　银行从业　司法考试　导游证　教师资格 财会类| 会计证　经济师　会计职称　注册会计　税务师

工程类| 一级建造　二级建造　造价师　造价员　咨询师　监理师 医学类| 卫生资格　执业医师　执业药师　执业护士　国际护士

计算机| 等级考试　软件水平　应用能力　其它类| 书画等级　美国高考　驾驶员　书法等级　少儿英语　报检员　单证员　出国留学

招生考试网 - 计算机等级考试 - 考试辅导 - 正文

海量文件的分布式计算处理方案

来源:fjzsksw.com 2010-1-11 编辑:zhoupanyu 【字体:小大】

Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以不考虑内存泄露一样， MapReduce的run-time系统会解决输入数据的分布细节，跨越机器集群的程序执行调度，处理机器的失效，并且管理机器之间的通讯请求。这样的模式允许程序员可以不需要有什么并发处理或者分布式系统的经验，就可以处理超大的分布式系统得资源。

　　第2步. 增加ssh不输入密码即可登陆。

　　因为Hadoop需要不用输入密码的ssh来进行调度，在不su的状态下，在自己的home目录运行ssh-keygen -t rsa ,然后一路回车生成密钥，再进入.ssh目录,cp id_rsa.pub authorized_keys

　　详细可以man 一下ssh, 此时执行ssh hadoopserver，不需要输入任何密码就能进入了。

　　3.格式化namenode，执行

　　bin/hadoop namenode -format

　　4.启动Hadoop

　　执行hadoop/bin/start-all.sh, 在本机启动namenode,datanode,jobtracker,tasktracker

　　5.现在将待查找的log文件放入hdfs,。

　　执行hadoop/bin/hadoop dfs 可以看到它所支持的文件操作指令。

　　执行hadoop/bin/hadoop dfs put log文件所在目录 in ，则log文件目录已放入hdfs的/user/user-name/in 目录中

　　6.现在来执行Grep操作

　　hadoop/bin/hadoop demo.hadoop.HadoopGrep in out

　　查看hadoop/logs/里的运行日志，重新执行前。运行hadoop/bin/hadoop dfs rmr out 删除out目录。

　　7.运行hadoop/bin/stop-all.sh 结束

　　3.3 集群运行模式

　　假设已执行完3.2的配置，假设第2台机器名是hadoopserver2

　　1.创建与hadoopserver同样的执行用户，将hadoop解压到相同的目录。

　　2.同样的修改haoop-env.sh中的JAVA_HOME 及修改与3.2同样的hadoop-site.xml

　　3. 将hadoopserver中的/home/username/.ssh/authorized_keys 复制到hadoopserver2,保证hadoopserver可以无需密码登陆hadoopserver2

　　scp /home/username/.ssh/authorized_keys username@hadoopserver2:/home/username/.ssh/authorized_keys

上一页
1
2
3
4
5
下一页

分享到： QQ空间新浪微博腾讯微博人人网

2011年计算机等级考试四级数据库故障管理有哪些
2011年计算机等级考试二级VB怎样按钮控件
2011年计算机等级考试二级VB怎样标签控件
2011年计算机等级考试二级VB怎样创建状态栏
2011年计算机等级考试二级VB怎样设置窗体的位置
怎样提高无线网络安全
系统不显示输入法的解决办法有哪些
怎样选择好网络综合布线系统中的线缆
举例双网卡共享Adsl上网成功案例
怎样进Windows 7体验七大奇妙功能
怎样让Windows7系统下载节能

上一个文章：浏览器访问某个地址的过程

下一个文章： Java多线程模拟生产者与消费者实例

网站版权与免责声明
①由于各方面情况的不断调整与变化,本网所提供的相关信息请以权威部门公布的正式信息为准.
②本网转载的文/图等稿件出于非商业性目的,如转载稿涉及版权等问题,请在两周内来电联系.

最新文章

·	全国计算机二级考试2011年9月冲刺辅导
·	2011年计算机等级考试四级数据库故障管
·	2011年计算机等级考试二级VB怎样按钮控
·	2011年计算机等级考试二级VB怎样标签控
·	2011年计算机等级考试二级VB怎样创建状
·	2011年计算机等级考试二级VB怎样设置窗
·	怎样提高无线网络安全
·	系统不显示输入法的解决办法有哪些
·	怎样选择好网络综合布线系统中的线缆
·	举例双网卡共享Adsl上网成功案例
·	怎样进Windows 7体验七大奇妙功能
·	怎样让Windows7系统下载节能
·	怎样搞定Win7系统ADSL连接
·	怎样快速获取Word中图片资源
·	2011年计算机等级考三级PC技术考点复习
·	管理信息系统(MIS)阶段考点解析
·	计算机信息系统的定义与组成考点解析
·	数据库系统要实现的功能考点解析

推荐文章

·	计算机等级考试上机注意事项

热门文章

·	2011年计算机一级考试MS OFFICE上机考
·	2010年9月计算机二级考试二级c语言上机
·	学习在word2007中如何快速取消自动编号
·	C++组合数快速算法
·	如何在Excel 2007中创建双坐标系的图表
·	用Java来输出soap报文
·	三步搞定Windows7分区
·	优化预读文件提高Win7/Vista/XP系统的
·	Windows文件损坏怎么办？一条命令就搞
·	计算机等级考试上机注意事项
·	Java中的TCP/UDP网络通信编程
·	教你用Windows XP的安装盘修复系统
·	移动硬盘插上后很难在我的电脑显示，怎
·	Windows 7桌面快捷方式不见了怎么办
·	Java编程制作拼图游戏

【报名考试】

全国 | 黑龙江 | 吉林 | 辽宁 | 内蒙古
青海 | 宁夏 | 甘肃 | 新疆 | 陕西
西藏 | 北京 | 天津 | 河北 | 山东
江苏 | 安徽 | 河南 | 上海 | 浙江
福建 | 广东 | 山西 | 湖南 | 湖北
江西 | 广西 | 海南 | 云南 | 贵州
四川 | 重庆

【分省高校计算机考试】

黑龙江 | 吉林 | 辽宁 | 内蒙古 | 河北
北京 | 天津 | 新疆 | 甘肃 | 宁夏
青海 | 陕西 | 山西 | 河南 | 山东
江苏 | 安徽 | 浙江 | 福建 | 广东
海南 | 广西 | 江西 | 湖北 | 湖南
四川 | 上海 | 重庆 | 贵州 | 云南
西藏

【成绩查询】

【报考指南】

【试题答案】

【模拟试题】

【考试辅导】

计算机一级 | 计算机二级 | 计算机三级 | 计算机四级

【经验交流】

【高校计算机】