专门用来解决爬虫采集相关网站数据时模拟自动登录,验证码自动识别的问题;欢迎加入一起开发完善。
《Web Scraping with Python》用python写网络爬虫一书的源代码。
crawler4j is an open source web crawler for Java which provides a simple interface for crawling the Web. Using it, you can setup a multi-threaded web crawler in few minutes.
采集互联网图片的工程;主要采集baidu,sogo,ping,360搜索等搜索引擎和主要图片网站的图片;
数据采集程序,支持常见新闻网站数据,Twitter等社交网站数据采集,社交好友关系数据Neo4j图数据库展示等基础功能;
一个Java基础工具类,对文件、流、加密解密、转码、正则、线程、XML等JDK方法进行封装,组成各种Util工具类,同时提供以下组件: 1. 布隆过滤 2. 缓存 3. 数据库ORM(基于ActiveRecord思想) 4. HTTP客户端 5. IO 6. JSON ...
最近更新: 9年多前用于excel与javaBean转换的orm框架,旨在简化excel读取和写出,使普通开发人员通过几行代码就可以读取或者生成excel文件。另外处理掉excel大数据读写时候的问题
最近更新: 9年多前POI 工具类,Excel的快速导入导出,Excel模板导出,Word模板导出,可以仅仅5行代码就可以完成Excel的导入导出,修改导出格式简单粗暴,快速有效,easypoi值得你尝试
最近更新: 9年多前mblog (mtons blog)开源免费的Java博客系统,是一个简单、大气、美观、响应式设计的多人博客系统, 基于MySQL数据库; 具有性能优异、简单实用、安全稳定、支持全文检索的特点。
最近更新: 9年多前Ponly FS 提供一个对常见文件系统(本地文件系统/FTP/SFTP/OSS)统一访问的 API 接口,其核心接口只有一个 FileSystem 接口定义
最近更新: 9年多前一个使用 Kotlin 语言开发的天气网站,其他使用的技术包括 SpringBoot、Webmagic等。
最近更新: 9年多前JBrower - 使用DJNativeSwing开发的纯Java浏览器Demo - 2分钟把你的Web应用变成桌面客户端
最近更新: 9年多前AOS开发套件基于JavaEE技术体系,以“标准功能可复用、通用模块可配置、行业需求快速开发、异构系统无缝集成”为目标,为传统软件企业和互联网企业研发团队提供高效可控、随需应变、快速实现业务需求的全栈式技术解决方案。帮助企业落实IT策略、屏蔽技术壁垒,快速实现可水平扩展的7*24小时高可用业务...
最近更新: 9年多前xuijee是一个java快速开发框架(Xui+Spring+SpringMVC+Shiro+jdbcTemplate封装),代码量少、学习简单、功能强大、轻量级、易扩展、快来使用吧!!!
最近更新: 9年多前值得拥有的企业级j2ee应用开发框架套件,专业团队开发,完整的生态体系,活跃的社区氛围,无限的水平扩展能力,7*24不间断运维能力。
最近更新: 9年多前Jcseg是基于mmseg算法的一个轻量级开源中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了最新版本的lucene, solr, elasticsearch的分词接口。
最近更新: 9年多前基于spring mvc,spring,mybatis,quartz,activiti,shiro,等开源技术,作为JAVA项目的基础框架,提供稳定的框架整合以及依赖关系.以扩展和增强的方式整合,无过度封装,可自由的使用以及扩展.
最近更新: 9年多前Beetl目前版本是2.2.5,大小696K,相对于其他java模板引擎,具有功能齐全,语法直观,性能超高,开发和维护模板有很好的体验。是新一代的模板引擎。
最近更新: 9年多前