-
Java 多线程爬虫及分布式爬虫架构探索
所属栏目:[优化] 日期:2019-10-21 热度:191
这是 Java 爬虫系列博文的第五篇,在上一篇 Java 爬虫服务器被屏蔽,不要慌,咱们换一台服务器 中,我们简单的聊反爬虫策略和反反爬虫方法,主要针对的是 IP 被封及其对应办法。前面几篇文章我们把爬虫相关的基本知识都讲的差不多啦。这一篇我们来聊一聊爬[详细]
-
九个对Web开发者最有用的Python包,掌握这些,工资至少能涨涨
所属栏目:[优化] 日期:2019-10-21 热度:182
1、Matplotlib Matplotlib,正如其名称所暗示的那样,是一个用来绘制数学函数和模型的库;扩展了Numpy的作用,Matplotlib可以只用几行代码来创建图,条形图,散点图等诸多视觉表现。 2、BeautifulSoup4 BeautifulSoup4是go-to包,如果你为某些元素去解析HTM[详细]
-
详解Java锁机制:看完你就明白的锁系列之锁的状态
所属栏目:[优化] 日期:2019-10-21 热度:154
看完你就会知道,线程如果锁住了某个资源,致使其他线程无法访问的这种锁被称为悲观锁,相反,线程不锁住资源的锁被称为乐观锁,而自旋锁是基于 CAS 机制实现的,CAS又是乐观锁的一种实现,那么对于锁来说,多个线程同步访问某个资源的流程细节是否一样呢?[详细]
-
揭秘Kafka的高性能吞吐
所属栏目:[优化] 日期:2019-10-21 热度:120
Kafka作为时下开源消息系统,被广泛地应用在数据缓冲、异步通信、汇集日志、系统解耦等方面。相比较于RocketMQ等其他常见消息系统,Kafka在保障了大部分功能特性的同时,还提供了读写性能。 本文将针对Kafka性能方面进行简单分析,首先简单介绍一下Kafka的[详细]
-
如何使Pandas来加速你的代码?
所属栏目:[优化] 日期:2019-10-21 热度:145
Pandas对数据科学界来说是一份天赐的礼物。问任何一个数据科学家,他们喜欢如何使用Python处理他们的数据集,他们无疑会谈到Pandas。 Pandas是一个伟大的编程库的缩影:简单、直观、功能广泛。 然而,对数据科学家的一项常规任务,使用Pandas进行数千甚至[详细]
-
Go语言的中的For循环之大坑
所属栏目:[优化] 日期:2019-10-21 热度:147
For循环在我们日常编码中可能用的很多。在很多业务场景中我们都需要用for循环处理。但golang中的for循环有一个大大大的坑,大家可否遇到。直接上代码: 我们写一个测试类,定义一个切片数组,然后循环迭代每个元素,将元素的值放到另一个切片。循环finalAr[详细]
-
要不要赶个时髦,去建设一个「 中台 」?
所属栏目:[优化] 日期:2019-10-21 热度:135
很多技术人总是抱怨 新技术/新框架/新概念 太多了,总是学不完,抱怨实在是学不动了。哈哈,这不,最近「 中台 」这么火热,要不要停止抱怨,再咬咬牙学一波? 很多人都担心被技术新潮流所抛弃,所以当遇见不断涌现的新技术时,总是慌忙的去学习。可是其中[详细]
-
代码写成这样,老夫无可奈何!
所属栏目:[优化] 日期:2019-10-21 热度:109
你见过最无可奈何的代码是什么?今天,栈长就来总结一下我遇到过的一些神逻辑代码,不一定很全,但我真心写不出,真心让我自叹不如啊! 1、耍猴的好手段 还记得 XX 手机的抢购活动么,抢购按钮的代码类似是这样的: ahref=javasript:alert('抢购结束!')立即[详细]
-
18个Python脚本可加速你的编码速度
所属栏目:[优化] 日期:2019-10-21 热度:112
在本文中,我们向您介绍一些提示和技巧,以帮助您更快地编写代码 Python的可读性和设计简单性是其广受欢迎的两个主要原因。 一些常见的Python技巧可以帮助你提高编码速度。在您的日常编码练习中,以下技巧将非常有用。 1.在字符串中查找唯一元素 以下代码[详细]
-
Kubernetes节点之间的ping监控
所属栏目:[优化] 日期:2019-10-20 热度:74
在诊断Kubernetes集群问题的时候,我们经常注意到集群中某一节点在闪烁*,而这通常是随机的且以奇怪的方式发生。这就是为什么我们一直需要一种工具,它可以测试一个节点与另一个节点之间的可达性,并以Prometheus度量形式呈现结果。有了这个工具,我们还希[详细]
-
网络爬虫程序员被抓,我们还敢爬虫吗?细数那些Java爬虫技术
所属栏目:[优化] 日期:2019-10-20 热度:106
最近,某大数据科技公司因为涉嫌非法抓取某招聘网站用户的简历信息,公司被查封,负责编写抓取程序的程序员也将面临坐牢。 事情的大概经过是这样的: 某大数据科技公司老板丢给一个小小的程序员一个网站,告诉他把这个网站的数据抓取下来,咱们做一做分析[详细]
-
数据科学中一些不常用但很有用的Python库
所属栏目:[优化] 日期:2019-10-20 热度:102
导读 提到数据科学的python包,大家想到的估计是numpy,pandas,scikit-learn之类的,这里给大家介绍一些不常用,但是非常有用的python包,就像是痒痒挠,虽然大部分时间用不上,但是真要用起来,还是挺爽的。 Python是个了不起的语言。事实上,这是世界上[详细]
-
架构师知识储备——深入理解BIO、NIO、AIO
所属栏目:[优化] 日期:2019-10-20 热度:190
本文你将获取到:同/异步 + 阻/非阻塞的性能区别;BIO、NIO、AIO 的区别;理解和实现 NIO 操作 Socket 时的多路复用;同时掌握 IO 最底层最核心的操作技巧。 BIO、NIO、AIO 的区别是什么? 同/异步、阻/非阻塞的区别是什么? 文件读写最优雅的实现方式是什么? N[详细]
-
久等了,提高开发效率的Vue 技巧来了
所属栏目:[优化] 日期:2019-10-20 热度:167
最近俩月正好用 vue 做了一个大数据的项目,积累了很多心得。今天终于有机会分享出来了。 组件(component)的使用 vue 提供的模块化无疑是提高开发效率的神器,而且对于后期代码优化和维护也提供的极大地便利。 组件使用简介 vue 提供了组件功能,组件又可[详细]
-
一文搞懂如何在Spring Boot正确中使用JPA
所属栏目:[优化] 日期:2019-10-20 热度:137
JPA 这部分内容上手很容易,但是涉及到的东西还是挺多的,网上大部分关于 JPA 的资料都不是特别齐全,大部分用的版本也是比较落后的。另外,我下面讲到了的内容也不可能涵盖所有 JPA 相关内容,我只是把自己觉得比较重要的知识点总结在了下面。很多地方我[详细]
-
开发十年面试过1000个人,总结出这份高薪Java 试秘诀
所属栏目:[优化] 日期:2019-10-20 热度:196
【大咖·来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 目录: 框架是重点,但别让人感觉你只会山寨别人的代码 别只看单机版的框架,分布式也需要了解 对于数据库,别只知道增删改查,得了解性能优化 Java核心,围绕数据结构和性能优化准备面试[详细]
-
2019 年可以选用这些 Rust IDE/DE
所属栏目:[优化] 日期:2019-10-20 热度:138
【大咖·来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 最近一段时间 Rust 似乎开始从默默无闻走向聚光灯下,从微软宣布探索采用 Rust 替代 C/C++,到 Linux 内核维护者表示愿意接受Rust 作为驱动开发语言,再到 AWS 公开表示赞助 Rust,同时连[详细]
-
女友闹别扭不用担心,python做个软件轻松哄好
所属栏目:[优化] 日期:2019-10-20 热度:101
【大咖·来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 学编程难免有时觉得枯燥,但我们可以自己用编程来做一些有趣的事情,不仅可以排解自己的无聊,还可以给女朋友一个惊喜,增进两人感情! 人们都喜欢记住一些重要的日子,比如说跟女朋友认识[详细]
-
Golang不到100行实现一套灵活的JWT库
所属栏目:[优化] 日期:2019-10-20 热度:76
【大咖·来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 JWT 全 chen JSON Web Tokens 现在被广泛的应用于各种前后端分离的场景,他比传统的 Token Session 方式,更具灵活性。 当然网上也有很多开源的 JWT 库,非常之多,开源组织也提供了官方[详细]
-
搞定 Linux Shell 文本处理工具,看完这篇集锦就够了
所属栏目:[优化] 日期:2019-10-16 热度:70
Linux Shell是一种基本功,由于怪异的语法加之较差的可读性,通常被Python等脚本代替。既然是基本功,那就需要掌握,毕竟学习Shell脚本的过程中,还是能了解到很多Linux系统的内容。 Linux脚本大师不是人人都可以达到的,但是用一些简单的Shell实现一些常[详细]
-
炒作还是赌未来?量子技术深陷淘金狂潮
所属栏目:[优化] 日期:2019-10-16 热度:120
量子技术的概念出现之后,几乎所有的科幻小说、电影里都有它的身影。不管到底是不是强相关,只要遇见了没法解释说明的问题,就套用量子技术的概念来解释,仿佛量子技术是万能的。 随着技术的进步,量子技术也逐渐从虚无缥缈的概念变得真实可触,来自全球的[详细]
-
Java中牛逼哄哄的消息队列到底有什么用?
所属栏目:[优化] 日期:2019-10-16 热度:120
最近小千会听到很多学员说,在面试大型互联网公司的时候,很可能会被问到消息队列的问题: 在何种场景下使用了消息中间件? 为什么要在系统里引入消息中间件? 如何实现幂等? 链式调用是我们在写程序时候的一般流程,为了完成一个整体功能,会将其拆分成多个[详细]
-
如何避免新代码变包袱?阿里通用方法来了
所属栏目:[优化] 日期:2019-10-16 热度:171
什么是设计?什么是架构?从零开始建立一个新的系统,新写的每行代码都可能成为明天的历史包袱?如何能有效的在遗留代码上工作?今天,阿里资深技术专家辉子为我们带来NBF框架下软件工程架构设计通用方法论,值得细细品读。 Note:本文讨论的是基于服务化前提[详细]
-
还不懂微服务原理?阿里高级技术专家带你看透微服务的来龙去脉
所属栏目:[优化] 日期:2019-10-16 热度:176
我们先看下维基百科和百度百科给出的定义: 维基百科:2014年,Martin Fowler 与 James Lewis 共同提出了微服务的概念,定义了微服务是由以单一应用程序构成的小服务,自己拥有自己的行程与轻量化处理,服务依业务功能设计,以全自动的方式部署,与其他服[详细]
-
9款Kubernetes的无服务器工具,收藏了
所属栏目:[优化] 日期:2019-10-16 热度:111
继续分享Kubernetes的有用工具,本文为大家介绍9款Kubernetes的无服务器工具,朋友们喜欢的话,请多多评论转发,给更多的朋友。 1.Kubeless Kubeless是Kubernetes原生的无服务器框架,可让你部署少量代码,而不必担心基础架构的问题。Kubeless有开箱即用的[详细]