qepwqnp
- 浏览: 101632 次
- 性别:
- 来自: 成都
社区版块
- ( 0)
- ( 65)
- ( 47)
最新评论
-
sp42:
oracle 不是很吊的么,怎么连个分页都这么麻烦?
数据库分页大全(oracle利用解析函数row_number高效分页) -
metarnetyflu:
不知道哪里快了!!!over()是最慢的,rownum其次,r ...
数据库分页大全(oracle利用解析函数row_number高效分页) -
wfd0807:
09年发的博文,五年了,一定影响到了不少人。首先,你描述的三层 ...
数据库分页大全(oracle利用解析函数row_number高效分页) -
diyunpeng:
学习了,写的不错。
python urlopen使用代理 -
qepwqnp:
帖子沉的好深,涝起来
js_自己封装一个可查询frame中对象的一个方法
文章列表
本文章部分内容为转载-----
本人学习python中,用得最多的还是各类爬虫脚本:写过抓代理本机验证的脚本,写过在discuz论坛中自动登录自动发贴的脚本,写过自动收邮件的脚本,写过简单的验证码识别的脚本,本来想写google music的抓取脚本的,结果有了强大的gmbox,也就不用写了。
-
这些脚本有一个共性,都是和web相关的,总要用到获取链接的一些方法,再加上simplecd这个半爬虫半网站的项目,累积不少爬虫抓站的经验,在此总结一下,那么以后做东西也就不用重复劳动了。
-
1.最基本的抓站
import urllib2
content = urllib2.urlopen(' ...
- 2011-06-19 20:20
- 浏览 2032
- 分类:编程语言
利用urllib包
import urllib
proxyconfig = 'http://%s:%s@%s' % ('username', 'password', 'proxy')
information = urllib.urlopen("http://tianya.cn", proxies={'http':proxyconfig})
print information.read()
username:用户名
password:密码
proxy: 代理加端口
利用urllib2包
import urllib2
proxyconfig = 'h ...
weburl = 'xyz'
print "get web %s is fail"(weburl)
提示错误:
print "get web %s is fail"(weburl)
typeerror: 'str' object is not callable
出错原因: 给字符串中%s赋值时前加上%
正确写法:
weburl = 'xyz'
print "get web %s is fail"%(weburl)
运行正常了,输出
get web ...
- 2011-06-17 14:25
- 浏览 8277
- 分类:编程语言
步骤:(无法上传图片)
1 确保tomcat在debug模式下启动
在启动文件catalina.bat中设置debug_opts
set debug_opts=-xdebug -xrunjdwp:transport=dt_socket,server=y,address=8765 //端口为8765
linux下可直接使用(默认debug端口为8000)
./catalina.sh jpda run
2 启动tomcat
tomcat运行时提示listening for transport dt_socketat address:8765,等待接入
3 设置ecl ...
- 2011-06-16 11:42
- 浏览 1779
- 分类:编程语言
本文出自http://blog.csdn.net/yeahq
,转载请注明出处
由于其运行环境的特殊性,javascript大量使用异步的通信机制,凡是涉及到网络调用和事件机制的代码都会涉及。在异步通信的环境下编码经常会用到
回调函数。javascript由于有� ...
- 2011-04-06 23:05
- 浏览 1041
转至:http://wangshuxing123-126-com.iteye.com/blog/703735
在linux下面部署应用的时候,有时候会遇上socket/file: can’t open so many files的问题,其实linux是有文件句柄限制的(就像winxp?),而且默认不是很高,一般都是1024,作为一台生产服务器,其实很容易就达到这个数量,因此我们需要把这个值改大一些。
大概知道ulimit这个命令是相关的,上google搜索了一下,大多数说的很含糊,也没有统一说一下,经过两个小时看了不少文章终于弄清楚ulimit相关的一些配置问题。
我们可以用uli ...
- 2011-04-03 11:08
- 浏览 828
- 分类:操作系统
描述:ethtool是用于查询及设置网卡参数的命令。
概要:
ethtool ethx //查询ethx网口基本设置
ethtool –h //显示ethtool的命令帮助(help)
ethtool –i ethx //查询ethx网口的相关信息
ethtool –d ethx //查询ethx网口注册性信息
ethtool –r ethx //重置ethx网口到自适应模式
ethtool –s ethx //查询ethx网口收发包统计
ethtool –s ethx [speed 10|100|1000]\ ...
- 2011-03-30 20:25
- 浏览 941
- 分类:操作系统
项目中有这样的需求,通过ip地址判断客户端是网通的还是电信的。从同事那拿了个纯文本的ip纯真数据库,用python写了一个小程序,感觉挺好的。点击这里
查看例子。
源码下载
#!/usr/bin/env python
# -*- coding: utf-8 -*-
from bisect import bisect
_list1, _list2 = [], []
_init = false
ip2int = lambda ip_str: reduce(lambda a, b: (a << 8) b, [int(i) for i in ...
- 2011-03-28 23:11
- 浏览 839
转自:http://yangguangfu.javaeye.com/blog/796062
一,重要性androidmanifest.xml是android应用程序中最重要的文件之一。它是android程序的全局配置文件,是每个 android程序中必须的文件。它位于我们开发的应用程序的根目录下,描述了package� ...
- 2011-03-22 19:56
- 浏览 763
launcher的androidmanifest.xml文件有很多特殊性,分析一下就会理解整个程序的大概结构。
代码如下:
<
manifest
xmlns:android
=
http://schemas.android.com/apk/res/android
package
=
"net.sunniwell.launcher"
android:versioncode
=
"1"
android:versionname
=
&q ...
- 2011-03-22 11:50
- 浏览 885
这个章节描述怎么实现一个基本的android界
面。它涉及构建屏幕基本元素,怎么在xml(定义文件)内定义屏幕、用你的代码生成、在不同任务你需要操作你的用户接口。
android
生成屏幕有三种方式:xml配置生成;通过你自己� ...
- 2011-03-21 21:56
- 浏览 724
源文出版:http://darkbull.net/101/将阿拉伯数字转换成中文
周末在家,写了个小程序,用于将阿拉伯数字转换化大写中文。程序没经过任何优化,出没经过详细的测试,挂到网上,方便将来有需要的时候直接拿来用。
源码测试代码
#!/usr/bin/python
#-*- encoding: utf-8 -*-
import types
class notintegererror(ex ...
- 2011-03-21 12:48
- 浏览 979
js_自己封装一个可查询frame中对象的一个方法
- 博客分类:
- 原创
说明
用途: 查询当前页面以及所包含的frame中id为传入的参数的对象,如本身页面为frame,还可查询上级页面中id为传入参数的对象。
参数:可传入对象id,以及对象本身
返回:返回所传id的对象
用法:如查询id为javaeye的对象
var xx = $$('javaeye');
方法原码如下:
function $$(id){
if(typeof id == 'string'){
var obj = document.getelementbyid(id);
if(obj)return obj;
var p = ...
我们会有这样的需求:为了工程结构统层次清晰,在开发时不将工程定义为eclipse标准工程结构,如
|--src
|--java
|_-main
|--相关java源代码
|--docment
|--相关文档
|--resource
|--相关配置文件
|--database
|--数据库操作语句
|--webapp
|--web-inf
|--。。。。
这个时候,我们想在eclipse中运行这个工程,就必须指定工程wabapp的目录,操作步骤如下:
servers--new serve ...
- 2011-01-11 16:44
- 浏览 1235
- 论坛回复 / (0 / 2331)
- 分类:web前端