📍

选择城市

立即咨询
精选文章 / 深度解读

VBA网抓之关键词抓取

【分享成果,随喜正能量】懒惰是很奇怪的东西,它使你以为那是安逸,是休息,是福气;但实际上它所给你的是无聊,时倦怠,是消沉;它剥夺你对前途的希望,割断你和别人之间的友情,使你心胸日益狭窄,对人生也越来越 ......

【分享成果,随喜正能量】懒惰是很奇怪的东西,它使你以为那是安逸,是休息,是福气;但实际上它所给你的是无聊,时倦怠,是消沉;它剥夺你对前途的希望,割断你和别人之间的友情,使你心胸日益狭窄,对人生也越来越怀疑。尽量的学习,尽量的尽力,尽量的,尽量的吃好东西,人生就比较美好一点,就是这么简单。

《VBA信息获取与处理》教程是我推出第六套教程,目前已经是第一版修订了。这套教程定位于最高级,是学完初级,中级后的教程。这部教程给大家讲解的有:跨应用程序信息获得、随机信息的利用、电子邮件的发送、VBA互联网抓取、VBA延时,剪贴板应用、Split函数扩展、工作表信息与其他应用交互,FSO对象的利用、工作表及文件夹信息的获取、图形信息的获取以及定制工作表信息函数等等内容。程序文件通过32位和64位两种OFFICE系统测试。是非常抽象的,更具研究的价值。

教程共两册,八十四讲。今日的内容是专题六“VBA中利用XMLHTTP完成网抓数据”的第2讲:VBA网抓之关键词抓取


第二节 利用XMLHTTP抓取百度查询关键词结果的个数

在上一讲中我们讲解了一些常用的概念,以及XMLHTTP在应用时常用的一些属性和方法,从这一讲开始,我们开始逐渐学习利用XMLHTTP的这些属性和方法来抓取网络的数据。

我们这讲要实现的目的:在一个EXCEL页面中有若干个关键词,我们要利用搜索引擎在网络中进行搜索,然后把搜索到的结果进行反馈。如下图:


1 应用XMLHTTP实现反馈搜索结果的思路分析


为了实现上述的目的,我们要首先建立一个引用,引用一下XMLHTTP;然后利用XMLHTTP的方法实现相应关键字的查询,所以利用https://www.baidu.com/s?wd+关键字的搜索。这里将利用XMLHTTP的open方法。

对于返回的结果是XMLHTTP的responseText属性,在上一讲的讲解中我们讲过XMLHTTP的responseText属性结果返回为字符串。

我们要在这个字符串中提取出我们要结果。我们可以先看看在一个实际的网页中查询的结果的responseText字符串:


关于上述字符串的解释我将在下个专题给大家讲解。

最后我们将利用数组函数在上面的字符串中分解出查询的结果。利用的数组函数是Split。

2 应用XMLHTTP实现反馈搜索结果的代码实现


下面我们看看VBA代码是如何实现上述思路的:

Sub myNZ() 'VBA抓取百度查询关键词结果的个数

【代码略,见程序源码文件】

End Sub

上述代码实现我们的思路,这也是一段非常实用的代码,希望大家能利用。

代码的讲解:

1)UU = Cells(i, 1).Value 是对搜索关键字的提取

2)Set objXMLHTTP = CreateObject("MSXML2.XMLHTTP") 建立一个对象,并将这个对象赋值为建立起来的XMLHTTP对象。

3)strURL = "https://www.baidu.com/s?wd=" & UU 建立一个字符串,用于我们发送http请求的地址。

4).Open "GET", strURL, False '创建一个新的http请求,并指定此请求的方法、URL以及验证信息(用户名/密码) 在这句代码中利用的GET方法,还有一种方法是POST,这两种方法有什么区别呢?这个问题我们会在后续的讲解中提到。

5).send 是发送请求到http服务器并接收回应

6) strJG = .responseText 用字符串接受返回结果.responseText。

7) Cells(i, 3) = Split(Split(strJG, "百度为您找到相关结果")(1), "<")(0) 这句代码是利用Split(Split(strJG, "百度为您找到相关结果")(1), "<")(0) 来返回搜索返回的条目数,这段代码可以仔细理解一下,如果不是很清楚Split的作用大家可以参考我的第三套教程《VBA数组与字典解决方案》

8)Set objXMLHTTP = Nothing 清空内存

代码截图:


3 应用XMLHTTP实现反馈搜索结果


通过上面的代码过程,我们看看反馈的结果:

从上面的结果中,我的各套教程是非常受欢迎的,哈哈。


本节点回向:如何利用XMLHTTP的属性和方法反馈网页中的关键词的搜索结果呢?

本讲参考程序文件:006工作表.XLSM


我20多年的VBA实践经验,全部浓缩在下面的各个教程中,教程学习顺序:


阅读重点

这篇内容能帮你快速理解什么

帮助快速理解主题

通过更完整的主题说明和结构表达,帮助用户更快抓住重点,也让搜索系统更容易识别页面主题。

帮助判断下一步动作

让访问者快速理解当前问题、可行方法以及下一步应该继续看案例、看服务还是直接沟通。

帮助继续浏览与沟通

文章页不只是获取流量,也承担继续阅读、查看服务和发起咨询的承接作用。

继续了解

继续了解这个主题前,你可能还关心这些问题

为什么这类主题适合写成文章?

因为很多用户会通过问题词、对比词和方案词进入网站,文章页越清楚,越容易覆盖更具体的需求。

为什么文章页不能只有正文?

仅有正文不利于继续浏览和转化,文章页还需要总结、问答、相关推荐与咨询入口来承接用户。

看完之后下一步可以做什么?

可以继续看同类文章、服务页与案例页,也可以直接沟通官网升级与搜索优化需求。

这篇文章能帮助我解决什么具体问题?

这篇文章围绕当前主题提供了详细的解决方案、操作步骤和注意事项,帮助你快速理解核心要点并应用到实际场景中。

如何判断这篇文章的内容是否权威可靠?

内容基于实际项目经验和技术实践编写,结合行业标准和最佳实践,同时提供案例数据和方法论支撑,确保专业性和可操作性。

这类内容对SEO和网站排名有什么帮助?

优质的长文内容和FAQ结构能够提升页面主题相关性、增加用户停留时间、降低跳出率,这些都有助于搜索引擎评估页面质量并提升排名表现。

AI搜索引擎会如何理解和引用这类内容?

AI搜索系统会提取文章的实体信息、观点结论和结构化问答,当用户提出相关问题时,可能会引用本文作为答案来源或参考依据。

如果我有更多相关问题可以咨询谁?

可以通过页面底部的联系方式直接咨询我们的专业团队,包括电话、QQ或在线表单,我们会根据你的具体情况提供针对性的建议和方案。

这篇文章和同类内容有什么不同之处?

本文不仅提供理论知识,还包含实战经验、避坑指南和可执行的行动建议,同时兼顾传统SEO和新兴的GEO生成式搜索优化视角。

多久需要更新一次这类内容以保持时效性?

建议每季度审查并更新一次关键数据和案例,如果涉及技术工具或算法变化则需要更频繁地维护,确保内容持续为用户提供准确价值。