快速业务通道

linux下定时自动执行某个进程

作者 佚名技术 来源 Linux系统 浏览 发布时间 2012-04-29

最近在学习nutch,想让它每天自动去抓取我们学校的网站内容.cron正是解决这个问题的工具.

cron是linux下定时执行工具,可在完全无人工干预的情况下作业.可以用一下命令来手动开启或关闭该任务:

/sbin/service crond start 启动服务

/sbin/service crond stop 关闭服务

/sbin/service crond restart 重新启动服务

/sbin/service crond reload 重新加载服务

cron 配置计划任务的书写格式:

分钟 小时 日 月 周 [用户名] 命令

说明:

第一段应该定义的是:分钟,表示每个小时的第几分钟来执行.范围是从0-59

第二段应该定义的是:小时,表示从第几个小时来执行,范围是从0-23

第三段应该定义的是:日期,表示从每个月的第几天执行,范围从1-31

第四段应该定义的是:月,表示每年的第几个月来执行,范围从1-12

第五段应该定义的是:周,表示每周的第几天执行,范围从0-6,其中 0表示星期日.

每六段应该定义的是:用户名,也就是执行程序要通过哪个用户来执行,这个一般可以省略;

第七段应该定义的是:执行的命令和参数.

在系统中,/etc目录下,有cron.daily,cron.hourly,cron.monthly,cron.weekly文件目录,我们只需要在相应目录下添加写好的shell文件就可以自动定时执行.

如我希望nutch能在每天早晨9点0分开始自动抓取,可以这样实现:

[root@localhost cron.daily]# touch autonutch.sh

[root@localhost cron.daily]# chmod 755 autonutch.sh /*改变autonutch.sh的访问权限*/

[root@localhost cron.daily]# echo "/home/sunny/nutch/bin/nutch crawl urls -dir crawl" > autonutch.sh

[root@localhost cron.daily]# more autonutch.sh

/home/sunny/nutch/bin/nutch crawl urls -dir crawl

凌众科技专业提供服务器租用、服务器托管、企业邮局、虚拟主机等服务,公司网站:http://www.lingzhong.cn 为了给广大客户了解更多的技术信息,本技术文章收集来源于网络,凌众科技尊重文章作者的版权,如果有涉及你的版权有必要删除你的文章,请和我们联系。以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息,谢谢!

分享到: 更多

Copyright ©1999-2011 厦门凌众科技有限公司 厦门优通互联科技开发有限公司 All rights reserved

地址(ADD):厦门软件园二期望海路63号701E(东南融通旁) 邮编(ZIP):361008

电话:0592-5908028 传真:0592-5908039 咨询信箱:web@lingzhong.cn 咨询OICQ:173723134

《中华人民共和国增值电信业务经营许可证》闽B2-20100024  ICP备案:闽ICP备05037997号