Excel Home
全球知名的Excel资源网站之一

你会用函数实现网页数据抓取吗?

HI~大家好,我是星光。

话说随着互联网的高速发展,网页数据愈发成为数据分析过程中最重要的数据来源之一……也许正是基于这样的考量,从2013版开始,Excel新增了一个名为Web的函数类别,使用该类别的函数,咱们可以通过网页从Web服务器获取数据,比如股票信息、天气查询、有道翻译、男女情缘等等。

打个响指,高大上的开场白结束了,下面举个小栗子。

如上图所示,在B2单元格输入以下公式,可以将A2单元格的值进行英汉或汉英互译▼

=FILTERXML(WEBSERVICE(“http://fanyi.youdao.com/translate?&i=”&A2&”&doctype=xml”),”//translation”)

公式看起来很长,这主要是因为网址长度偏长的缘故,实际上该公式的结构非常简单。

看我手指,歪、涂、斯瑞,它主要有3部分构成。

第1部分构建网址。

“http://fanyi.youdao.com/translate?&i=”&A2&”&doctype=xml”

这是有道在线翻译的网页地址,包含了关键的参数部分,i=”&A2是需要翻译的词汇,doctype=xml是返回文件的类型,是xml。只所以返回xml是因为FILTERXML函数可以获取XML结构化内容中的信息。

第2部分读取网址

WEBSERVICE函数可以通过指定的网页地址从Web服务器获取数据(需要计算机联网状态)

本例中,B2公式▼

=WEBSERVICE(“http://fanyi.youdao.com/translate?&i=”&A2&”&doctype=xml&version”)

获取数据如下

第3部分获取目标数据

这里使用了FILTERXML函数,FILTERXML函数语法如下▼

FILTERXML(xml,xpath)

该函数共有两个参数,xml参数是有效的xml格式文本,xpath参数是需要查询的目标数据在xml中的标准路径。

通过第2部分获取的xml文件内容,我们可以很直接的看到看见星光的翻译结果See the stars处于translation路径下(第6至第8行代码),因此第2参数设为//translation。

……

OK,这就是今天和大家分享的内容,感兴趣的小伙伴可以尝试使用web函数从百度天气预报获取家乡城市的天气信息~

由于FILTERXML可以从XML格式文本中获取数据,因此当XML文本是由我们刻意搭建产生的字符串时,就会有很多奇妙的用法,比如用该函数实现VBA编程Split函数的效果,关于这一点,咱们以后有缘再聊。

赞(63)
未经允许不得转载:ExcelHome » 你会用函数实现网页数据抓取吗?
分享到

关于我们联系我们
本站特聘法律顾问:李志群律师   沪ICP备11019229号-2

沪公网安备 31011702000001号

征信