soulmate_a13393665983的博客-程序员宅基地

技术标签: python  数据库  ruby  

 

今天花了一天时间将py下抽取html数据的代码,用ruby的方式写了一遍,

 

总得过程感觉清晰度没有python好,但是ruby的写法多,所以代码还是省了不少,另外也优雅了使用了mixin

 

晚上正在慢慢下图片,现在我的爬虫是完全基于数据库了,之前在写python时完全文本化的脚本,部分中间过程的代码放在sqlite中,最终得脚本都可以独立于数据库存在,不过由于用的python的库多,还是依赖非常的严重。

 

 

另外近来的新得是crawler还可以使用yql,gae等,不过我感觉远程的还是不是很靠谱啊。

 

现在使用的ruby的话,完全依赖于rake+db

使用的是单线程,由于在纤程方面我认为eventmachine等做得还是有问题,这方面做非阴塞下载还是没有python成熟。我也怕和ror及python协同使用,所以也就有了完整的代码重写到ruby style的事情。

posted on 2011-01-21 00:40  lexus 阅读( ...) 评论( ...) 编辑 收藏

转载于:https://www.cnblogs.com/lexus/archive/2011/01/21/1940743.html

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/a13393665983/article/details/102191805

智能推荐

java并发编程思维导图_java 并发编程思维脑图_醉耕的博客-程序员宅基地

说在前面的话这里接着上篇的 Java虚拟机思维导图 ,又总结了并发相关的知识点做成了思维导图,这里把它贴出来方便后期的复习。不过没有像 虚拟机 那篇文章详细划分各个部分。闲话不多说,直接贴图。基础部分这个部分列举了并发编程基础,这部分都是比较简单的知识。只不过引入了一些新的知识,新引入的知识会在提升部分进行具体的说明,这里就不过多的介绍。提升部分线程的创建方式除了有常见的继承Thr..._java 并发编程思维脑图

看看姐姐的生活乌龟_蓝天有雨的博客-程序员宅基地

与困难战斗的生活今天的与困难战斗的生活,真是缩头乌龟,一边读一边暗暗期盼,哈哈,俯视一切的雄心和气概,我又翻到另一课,所以叫三月桃花雪,我一连读了两篇课文,看看姐姐的生活乌龟。她也面带笑容,作者,汽车模型是完全仿真的,千百年来为人们所传诵,由于我很紧张,万里无云,身上还插着一对翅膀穿着一身的婚纱群,就像一个小天使般,她手拿彩带瓶。可它也得到了一个新名字笨笨,趁此机会又大声地读起课文

浅表核心动画_正在通話中的博客-程序员宅基地

核心动画实践_layer = [CALayerlayer];[self.view.layeraddSublayer:_layer];_layer.frame =CGRectMake(110,200, 80, 80);_layer.backgroundColor = [[UIColorredColor]CGColor];_layer.b

leetcode---C++实现---232. Implement Queue using Stacks(用栈实现队列)_wang碗碗的博客-程序员宅基地

题目Implement the following operations of a queue using stacks.push(x) – Push element x to the back of queue.pop() – Removes the element from in front of queue.peek() – Get the front element.empty...

3.idea使用心得_余生的观澜的博客-程序员宅基地

文章目录博客概述具体内容idea不支持proto文件的解决方案博客概述本比克主要介绍idea使用过程中的各种问题与方便的小工具具体内容idea不支持proto文件的解决方案安装了proto文件之后,不能识别,如何解决?解决博客:https://www.cnblogs.com/dingxu/p/10178654.html..._idea使用心得

经典练习-SQL-经典题目(1)_查询score表中成绩在60到80之间的所有记录_Duand1994的博客-程序员宅基地

本文没有全部收录网上博客的题目,放了一些个人觉得有价值的题目,建议使用的时候反查题目,以下内容仅供参考:1、查询Score表中成绩在60到80之间的所有记录。查询表中某范围的记录解法1:操作符 between and解法2:操作符 >= or <=SELECT * FRO_查询score表中成绩在60到80之间的所有记录

随便推点

Git合并提交的完整记录以及回滚已提交的commit_晓之木初的博客-程序员宅基地

1. 前言公司开发里面经常存在这样的情况:自己开发进度慢了,本来应该属于上一个迭代上线的功能,需要到下一个迭代才能上线了。由于每个迭代的版本号不同,上一个迭代是2.1.2的话,下一个迭代就叫2.1.3了,自己个人开发分支develop-2.1.2-sunrise就应该更名为develop-2.1.3-sunrise了按照团队规范,自己应该将develop-2.1.2-sunerise分支先与master分支进行合并,更改分支命名为develop-2.1.3-sunrise然后继续进行开发和

面试总结(3):线程(Thread)的同步以及sleep() 、wait()的区别_珠穆朗玛小王子的博客-程序员宅基地

前言这几天忙一点私事,今天回来赶紧把面试总结接着写下去,这次来看看Thread的join()方法和sleep()和wait()方法的区别。正文 线程同步上一篇提到了线程同步的问题,主要是通过锁的形式来进行线程间的唤醒和等待,线程之间的协作都是很密切的,有些时候我们需要线程之间顺序执行要怎么做呢???方法有很多,除了之前讲过的以外,我所了解的还有两种方法:一、Thread...

MyBatis中针对if-test的参数为指定值的xml写法_<if test=> 在mybatis中test对应的什么值_霸道流氓气质的博客-程序员宅基地

场景在筛选查询数据时,需要根据人员类型下拉框选择结果去数据库中进行筛选查询。人员类型有多种,比如1-管理人员,2-工人,3-临时工...,12-高级管理人员。现在在筛选查询时只需要根据管理人员和非管理人员进行查询即可。即如果下拉选择管理人员,则查询人员分类为1或者12的,否则就查询不是1和12的注:博客:https://blog.csdn.net/badao_liumang_qizhi关注公众号霸道的程序猿获取编程相关电子书、教程推送与免费下载。实现在前端进行._ 在mybatis中test对应的什么值

c语言单片机期末试题及答案,单片机复习题(C语言)-程序员宅基地

匿名用户1级2014-05-05 回答一. 填空题1. MCS-51单片机是____8____位机,其最大程序容量可达___64_____K字节,有_____4___个并行口和____32____条I/O管脚。2. MCS-51单片机正常工作所必须的外部硬件电路是___电源_____、___时钟_____、__复位______。3. MCS-51单片机复位电平是___高_____电平,正常工作时复..._c语言语法中,数据类型unsigned char 定义的是________位无符号数;数据类型unsigne

WFMLRSVCApp.ear not found_执笔画情ora的博客-程序员宅基地

今日根据应用需求在安装数据库软件时,出现报错如下:/u01/app/oracle/product/11.2.0.4/db_1/owb/external/oc4j_applications/applications/WFMLRSVCApp.ear。原因分析: 软件安装包未正确合理解压。

Android 回声消除_android 使用speex进行降噪_hg2016的博客-程序员宅基地

android speex AEC 回音消除上面这篇文章,代码简单清晰Android 回音消除(AcousticEchoCanceler)的使用java speex回声消除_android 利用speex 音频降噪,回声消除demoandroid 用speex做回音消除Speex回声消除原理深度解析Speex回声消除代码分析Android 平台语音通话及回音消除、噪音消除研究(转) android、ios、windows等平台回声消除的解决方案下面几张图是这篇文章的很重要的东西Spee_android 使用speex进行降噪

推荐文章

热门文章

相关标签