海量文件的分布式计算处理方案

收藏网站

设为首页

学历类| 阳光高考　研究生　自学考试　成人高考　专升本　中考会考 外语类| 四六级　职称英语　商务英语　公共英语　日语能力

资格类| 公务员　报关员　银行从业　司法考试　导游证　教师资格 财会类| 会计证　经济师　会计职称　注册会计　税务师

工程类| 一级建造　二级建造　造价师　造价员　咨询师　监理师 医学类| 卫生资格　执业医师　执业药师　执业护士　国际护士

计算机| 等级考试　软件水平　应用能力　其它类| 书画等级　美国高考　驾驶员　书法等级　少儿英语　报检员　单证员　出国留学

招生考试网 - 计算机等级考试 - 考试辅导 - 正文

海量文件的分布式计算处理方案

来源:fjzsksw.com 2010-1-11 编辑:zhoupanyu 【字体:小大】

Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以不考虑内存泄露一样， MapReduce的run-time系统会解决输入数据的分布细节，跨越机器集群的程序执行调度，处理机器的失效，并且管理机器之间的通讯请求。这样的模式允许程序员可以不需要有什么并发处理或者分布式系统的经验，就可以处理超大的分布式系统得资源。

　　4.修改hadoop-server的hadoop/conf/slaves文件, 增加集群的节点，将localhost改为

　　hadoop-server

　　hadoop-server2

　　5.在hadoop-server执行hadoop/bin/start-all.sh

　　将会在hadoop-server启动namenode,datanode,jobtracker,tasktracker

　　在hadoop-server2启动datanode 和tasktracker

　　6.现在来执行Grep操作

　　hadoop/bin/hadoop demo.hadoop.HadoopGrep in out

　　重新执行前,运行hadoop/bin/hadoop dfs rmr out 删除out目录

　　7.运行hadoop/bin/stop-all.sh 结束。

　　四、效率

　　经测试，Hadoop并不是万用灵丹，很取决于文件的大小和数量，处理的复杂度以及群集机器的数量，相连的带宽，当以上四者并不大时，hadoop优势并不明显。

　　比如，不用hadoop用java写的简单grep函数处理100M的log文件只要4秒，用了hadoop local的方式运行是14秒，用了hadoop单机集群的方式是30秒，用双机集群10M网口的话更慢，慢到不好意思说出来的地步。

上一页
1
2
3
4
5

分享到： QQ空间新浪微博腾讯微博人人网

2011年计算机等级考试四级数据库故障管理有哪些
2011年计算机等级考试二级VB怎样按钮控件
2011年计算机等级考试二级VB怎样标签控件
2011年计算机等级考试二级VB怎样创建状态栏
2011年计算机等级考试二级VB怎样设置窗体的位置
怎样提高无线网络安全
系统不显示输入法的解决办法有哪些
怎样选择好网络综合布线系统中的线缆
举例双网卡共享Adsl上网成功案例
怎样进Windows 7体验七大奇妙功能
怎样让Windows7系统下载节能

上一个文章：浏览器访问某个地址的过程

下一个文章： Java多线程模拟生产者与消费者实例

网站版权与免责声明
①由于各方面情况的不断调整与变化,本网所提供的相关信息请以权威部门公布的正式信息为准.
②本网转载的文/图等稿件出于非商业性目的,如转载稿涉及版权等问题,请在两周内来电联系.

最新文章

·	全国计算机二级考试2011年9月冲刺辅导
·	2011年计算机等级考试四级数据库故障管
·	2011年计算机等级考试二级VB怎样按钮控
·	2011年计算机等级考试二级VB怎样标签控
·	2011年计算机等级考试二级VB怎样创建状
·	2011年计算机等级考试二级VB怎样设置窗
·	怎样提高无线网络安全
·	系统不显示输入法的解决办法有哪些
·	怎样选择好网络综合布线系统中的线缆
·	举例双网卡共享Adsl上网成功案例
·	怎样进Windows 7体验七大奇妙功能
·	怎样让Windows7系统下载节能
·	怎样搞定Win7系统ADSL连接
·	怎样快速获取Word中图片资源
·	2011年计算机等级考三级PC技术考点复习
·	管理信息系统(MIS)阶段考点解析
·	计算机信息系统的定义与组成考点解析
·	数据库系统要实现的功能考点解析

推荐文章

·	计算机等级考试上机注意事项

热门文章

·	2011年计算机一级考试MS OFFICE上机考
·	2010年9月计算机二级考试二级c语言上机
·	学习在word2007中如何快速取消自动编号
·	C++组合数快速算法
·	如何在Excel 2007中创建双坐标系的图表
·	用Java来输出soap报文
·	三步搞定Windows7分区
·	优化预读文件提高Win7/Vista/XP系统的
·	Windows文件损坏怎么办？一条命令就搞
·	计算机等级考试上机注意事项
·	Java中的TCP/UDP网络通信编程
·	教你用Windows XP的安装盘修复系统
·	移动硬盘插上后很难在我的电脑显示，怎
·	Windows 7桌面快捷方式不见了怎么办
·	Java编程制作拼图游戏

【报名考试】

全国 | 黑龙江 | 吉林 | 辽宁 | 内蒙古
青海 | 宁夏 | 甘肃 | 新疆 | 陕西
西藏 | 北京 | 天津 | 河北 | 山东
江苏 | 安徽 | 河南 | 上海 | 浙江
福建 | 广东 | 山西 | 湖南 | 湖北
江西 | 广西 | 海南 | 云南 | 贵州
四川 | 重庆

【分省高校计算机考试】

黑龙江 | 吉林 | 辽宁 | 内蒙古 | 河北
北京 | 天津 | 新疆 | 甘肃 | 宁夏
青海 | 陕西 | 山西 | 河南 | 山东
江苏 | 安徽 | 浙江 | 福建 | 广东
海南 | 广西 | 江西 | 湖北 | 湖南
四川 | 上海 | 重庆 | 贵州 | 云南
西藏

【成绩查询】

【报考指南】

【试题答案】

【模拟试题】

【考试辅导】

计算机一级 | 计算机二级 | 计算机三级 | 计算机四级

【经验交流】

【高校计算机】