悲剧了
- 浏览: 137814 次
- 性别:
- 来自: 上海
社区版块
- ( 0)
- ( 333)
- ( 10)
存档分类
- ( 1)
- ( 1)
- ( 1)
最新评论
-
:
②非数字如何处理 对于文档中只要出现某些文字,就提升权重,没有 ...
-
:
同感同感只不过是身处一个起点比较高的创业公司
-
:
看了一下豆瓣 感觉人气不旺 呵呵
-
悲剧了:
cuichang 写道要推荐去豆瓣,送货快是京东。其他价格之类 ...
-
:
要推荐去豆瓣,送货快是京东。其他价格之类的没多少区别。
文章列表
- 博客分类:
karaf常用命令纪录
karaf命令里面本身支持shell方式的还有subshell,所以根据需要没事可以--help,把常用的命令,切换为subshell下进行 exit退出 shell:completion first
feature安装 install使用最多,-v 展示正在做什么 -c失败不卸载 -s不自动startbundle(是否可以利用这个可以控制顺序) repo-add增加 repo-refresh刷新 info 最有用参数-t详细列出当前feature的依赖关系,类似maven,目前根据这个命令,用脚本写了一个自动下载features里面以来的bundle到本地仓库 ...
- 2014-11-11 17:26
- 浏览 1436
- 分类:企业架构
- 博客分类:
1.批量导入总是少1条数据,多线程导入,少得梳理跟线程数一样
忘记 conn.setautocommit( true);
conn.setautocommit(false);
object[] parmas = list.toarray();
ps = conn.preparestatement(sql, statement.return_generated_keys );
qr.fillstatement(ps, parmas);
...
- 2013-03-18 17:29
- 浏览 698
- 分类:编程语言
- 博客分类:
1.网上得数据下载到本地,利于快速分析 具体操作:java多线程 httputil
2.提取出关键信息进行分析 ,一般是key value键值对
分析数量 key value的状况 key value尽量不带html的东西
3.建立第二部中提取的key值与开发系统设计的key值关系规则
4.导入数据库,建立持续自动更新机制,跟系统集成的话就quartz等 或者直接linux的cron
根据上述key point 建立起对应的框架,分配任务,提供接口 写核心代码 迭代进行
上一篇blog就是在这个过程中写的一个工具类,快速的下载html
- 2013-02-21 09:18
- 浏览 1009
- 分类:企业架构
- 博客分类:
场景1:
项目放到国外服务器,配置ftp,上传老掉线,网速实在不如人意
解决:
wget方式下载,-c就ok,把你的东西放到一个url可以直接下载的地方,俺测试下了360云盘,报错不支持,可以找速度快并且稳定的地方上次,不行那就自己动手,放nginx里面,远程下载,不用操心
nuhop xxx & ,到时候看nohup.out就ok
场景2
收集网页分析数据,wget方式可以下载全站的,如果觉得速度太慢,不给力,自己动手
附带简单的下载代码
public class simpledownloadhtmlutil {
public logger log = logger. ...
- 2013-01-24 17:08
- 浏览 2232
- 分类:行业应用
- 博客分类:
一:用户积分功能设计
二:key point
1. 需要提统一业务规则与扩展业务规则,扩展负责经常变化部分,统一负责不改变部分,用单例模式配置规则,xml方式配置都可以
2. item与total监听器 --aop拦截配置可行,常规监听器模式浸入太多
- 2012-12-18 17:10
- 浏览 972
- 分类:研发管理
- 博客分类:
商业bi初步分析
场景:做一个中小型互联网项目,需要提供商业智能,支撑推荐功能 crm 广告系统等
思路如下:
1.用来来网站的每一次行为,进行log
2.对行为进行分类,提取不同的关键信息
3.不同行为导致不同的权重比例
4.每次的行为都放入搜索引擎文档,利用引擎来检索,如果不考虑不同行为的打分,效率等,数据库也是可以的
一段时间后,用户就会积累很多记录,那么我们根据不同行为的积累分析信息,利用搜索引擎特点,进行各种高效的关键字排名,权重打分排名
关键点:1.每次行为的提取--用户行为的分析,这直接导致了bi是否有效
2.搜索引擎文档的合理设计
- 2012-12-13 16:43
- 浏览 990
- 论坛回复 / (6 / 3375)
- 分类:行业应用
- 博客分类:
场景:中小型互联网垂直领域网站,项目广告系统置入分析:
keynote:固定位置 keywords导致广告唯一
1.固定位置广告
2.固定位置,关键字广告
3.非固定位置,关键字广告
收费:按照使用效果 按时间收费混合型收费标准
细节:
广告编号唯一性,销售方便
关键字集合sell,多人购买则出现随机情况
- 2012-12-13 16:10
- 浏览 1148
- 分类:行业应用
- 博客分类:
1.三个重要字段(bf,pf,qf)注意事项
①pf--字段配置都必须为index字段,否则使用会报错
②bf影响打分结果,结合solr提供的数学方式,但具体打分影响需要结合工具,debug模式查看,
跟想象差距很大
2.常见场景分析
①数字公式bf处理
淘宝排序:
1.在商品名称上出现搜索关键字排序靠前,而内容的次之
2.对多皇冠的买家排序靠前等
3.对近期发布的商品排序靠前
4.对最近销售多商品靠前
非索引字段造成很大影响,但不是排序,需要作为打分的一个要素,而不是order by,比如销量数字,可以配置通过配置bf,对索引到的文档综合打分进行影响
②非数字如何处理
对于文档中只要出现某 ...
- 2012-12-13 15:00
- 浏览 3785
- 分类:开源软件
- 博客分类:
[size=medium]真实需求与实际设计的矛盾
出现一些问题时候,往往就反映我们理解错了一些概念,运用错了一些东西。写东西是个好的方式,是让自己思考的一种方式,也是一种package,ok
场景:
系统内置发送信息,当用户提交的信息审核通过,发送信息给用户
信息--站内信 短信 邮件
提供发送信息的借口,分别实现。
public interface noticeuser {
void sendnoticeinfo(string title,string content,rbacuser rbacuser);
}
public cl ...
- 2012-11-13 11:16
- 浏览 1299
- 分类:企业架构
- 博客分类:
先假定一个model实体,有十六个字段,然后service提供update(model model)
现在要提供更新功能,通常根据划分为可修改字段,不可修改字段,我们提供修改功能的时候,反应到具体代码层
1.最简单form表单提交时候,传递参数拥有完整的16字段,虽然页面要么隐藏要么展现,可修改不可修改,种种折腾
提交处理:表单包含16个字段,全部提交,然后update
2.升级版,业务只需要提供16个字段中的三个字段修改,其它也不需要用户知道,上面的处理方式没问题,但是form表单参数搞写那么多字段很烦,大家都很懒,页面给需要更改的就好
提交处理:三个字段与表示字段就可以了
问题: ...
- 2012-08-22 17:16
- 浏览 959
- 论坛回复 / (2 / 1988)
- 分类:行业应用
- 博客分类:
由于业务需要,可能存在以下类似model,比如正式表 零时表
那么在很多时候,正式表的model的属性要copy到零时表中,有时候又涉及到对比,如果只涉及一次这种类似的操作,自己set也就无所谓,但类似业务多了,就需要抽象了,反射式比较好的方式,能抽象提取这些操作
用commons的beanutils 与spring的工具类封装了一个beanutilss
public class beanutilss {
/**
* 该方法对比不同bean实例中具有相同属性值是否相等,只对比neww中的属性
* @param neww--系统对象
* @param old- ...
- 2012-07-14 12:01
- 浏览 938
- 分类:行业应用
- 博客分类:
1.网络问题你全负责,有人上不了网会直接来找你
建立流程,网络问题就那些,写文档,找你之前,先按照文档操作,百分之99都可以解决
2.公司服务器宽带你全负责,如果出现问题有人来找你
这个没办法,很多不会要自己学.责任也要自己担当.
- 2012-07-05 17:41
- 浏览 1239
- 分类:非技术
- 博客分类:
effective java 第49条 基本类型优先于装箱类型
作者说道了两者的区别,这个大家都懂的,明显不一样的东西
个人觉得是不完全面向对象的产物,然后又提供语言级别的自动转换,两种东西都不是一类,越转问题越大,还不如统一使用
使用中的一些问题:
1.==的使用出现问题
2.null拆箱问题
比如:我的方法返回类型是int 但是调用框架类处理完成返回是integer,这个时候不检查null,问题就来了,
public int getctgid(string name)
{
return (integer)xx.xx(); ...
- 2012-06-06 11:24
- 浏览 865
- 分类:行业应用
- 博客分类:
数据整理备份:
1.采集数据的记录(包括采集规则,采集id分布情况)
2.转换程序备份(相关使用说明完整)
3.转换程序生产sql备份(必须有sql对应id系统库记录)
采集数据处理过程(采集的数据最终导入系统数据库):
1.对应我们数据库表导入相关字段转换成sql,转换前注意,清洗数据(去掉一些错误的信息,类型变更)
2.根据采集来的已有信息,推测出一些数据,比如根据许可证号可以推测出省市
评估原则:
不符合规则的数据,程序记录下来,比重小,人工修改
比重大则保证尽可能多转换为原则.只要能转换大于5%数据,则值得.
整个功能模块定位:
不在系统中集成,作为运营人员使用,网 ...
- 2012-05-23 15:27
- 浏览 893
- 分类:行业应用
- 博客分类:
1.设置自动连接断开时间,需要在数据库里配置好,避免下次机器重启后再次配置 隔几天就报连接错误,困扰好久了
引用
org.springframework.transaction.cannotcreatetransactionexception: could not open jdbc connection for transaction; nested exception is com.mysql.jdbc.exceptions.jdbc4.communicationsexception: the last packet successfully received from the se ...
- 2012-05-22 11:38
- 浏览 1425
- 分类:行业应用
« 上一页 1 …