eolink官网
  • 首页
  • api管理
  • API接口管理
  • API自动化测试
  • api文档
  • API网关
  • 接口自动化
  • 实现接口
  • 关键词
首页 包含"开源 第31页"标签的文章
  • 软件接口设计怎么做?前后端分离软件接口设计思路

    [置顶]软件接口设计怎么做?前后端分离软件接口设计思路

    API接口管理 •2022-09-21

    本文关于软件接口设计怎么做?前后端分离软件接口设计思路。好的系统架构离不开好的接口设计,因此,真正懂接口设计的人往往是软件设计队伍中的稀缺型人才。为什么在接口制定标准中说:一流的企业做标准,二流的企业...

    接口设计 软件接口设计 接口管理
  • 接口管理如何做?接口实现版本管理的意义和最佳方法

    [置顶]接口管理如何做?接口实现版本管理的意义和最佳方法

    API接口管理 •2022-10-27

    本文关于接口管理如何做?接口实现版本管理的意义和最佳方法。API版本管理的重要性不言而喻,对于API的设计者和使用者而言,版本管理都有着非常重要的意义。下面会从WEB API 版本管理的角度提供几种常...

    接口管理 api eolink eolinker
  • 实现API管理系统的关键

    [置顶]实现API管理系统的关键

    API接口管理 •2023-06-16

    下面将通过几个关键词的形式说明API管理的重要性和未来的实现方式。1.生命周期管理在整个API生命周期中更深入地集成所有工具将进一步提高生命周期循环的速度,而且更重要的是提供满足消费者需求的API。这...

    API API管理 API管理系统 实现API管理系统 实现API管理系统的关键 api管理工具
  • Java API文档工具:小白如何游刃有余编写Java中的API使用手册?

    Java API文档工具:小白如何游刃有余编写Java中的API使用手册?

    用户投稿 •2023-07-26

    对于初学者来说,Java API文档是解决问题和学习语言的重要工具。本文将介绍Java API文档工具的使用方法,帮助小白们轻松编写出优秀的API使用手册,供日后的开发之用·夯实基础。正文:第一节:J...

    Java 工具 文档 代码 开源
  • 接口在线测试:提高软件质量的关键步骤

    接口在线测试:提高软件质量的关键步骤

    用户投稿 •2023-07-25

    接口在线测试:提高软件质量的关键步骤在软件开发过程中,接口测试是一个至关重要的环节。通过接口在线测试,开发人员可以确保软件的各个组件之间能够正常通信和协作,从而提高软件的质量和稳定性。本文将介绍接口在...

    接口在线测试 接口 数据 开源 结果
  • 保护您的网站安全:http接口安全测试是必要的步骤!

    保护您的网站安全:http接口安全测试是必要的步骤!

    用户投稿 •2023-07-25

    在如今数字化的世界里,网站安全性日益受到重视。本文将探讨http接口安全测试的重要性,以及推荐的接口安全性测试工具和平台,帮助您更好地保护您的网站免受潜在的安全威胁。在如今互联网的浪潮下,网站扮演着企...

    接口 安全 http 开源 自动
  • HTTP接口性能测试:从指标到工具,全方位解析

    HTTP接口性能测试:从指标到工具,全方位解析

    用户投稿 •2023-07-25

    HTTP接口性能测试是现代软件开发中至关重要的环节。本文将详细介绍HTTP接口性能测试的重要性,关注点,测试方案,关键指标以及必备工具,帮助读者全面理解和应用性能测试,确保应用程序在高负载条件下运行稳...

    接口 工具 市场 开源 监控
  • }

    else if (tag instanceof ImageTag)// 标签

    {

    ImageTag image = (ImageTag) list.elementAt(i);

    System.out.print(image.getImageURL() + "********");//图片地址

    System.out.println(image.getText());//图片文字

    }

    else// 标签

    {

    //提取 frame 里 src 属性的链接如

    String frame = tag.getText();

    int start = frame.indexOf("src=");

    frame = frame.substring(start);

    int end = frame.indexOf(" ");

    if (end == -1)

    end = frame.indexOf(">");

    frame = frame.substring(5, end - 1);

    System.out.println(frame);

    }

    }

    } catch (ParserException e) {

    e.printStackTrace();

    }

    }

    简单强大的 StringBean

    如果你想要网页中去掉所有的标签后剩下的文本,那就是用 StringBean 吧。以下简单的代码可以帮你解决这样的问题:

    清单5

    StringBean sb = new StringBean();

    sb.setLinks(false);//设置结果中去点链接

    sb.setURL(url);//设置你所需要滤掉网页标签的页面 url

    System.out.println(sb.getStrings());//打印结果

    HtmlParser 提供了强大的类库来处理网页,由于本文旨在简单的介绍,因此只是将与笔者后续爬虫部分有关的关键类库进行了示例说明。感兴趣的读者可以专门来研究一下 HtmlParser 更为强大的类库。

    简易爬虫的实现

    HttpClient 提供了便利的 HTTP 协议访问,使得我们可以很容易的得到某个网页的源码并保存在本地;HtmlParser 提供了如此简便灵巧的类库,可以从网页中便捷的提取出指向其他网页的超链接。笔者结合这两个开源包,构建了一个简易的网络爬虫。

    爬虫 (Crawler) 原理

    学过数据结构的读者都知道有向图这种数据结构。如下图所示,如果将网页看成是图中的某一个节点,而将网页中指向其他网页的链接看成是这个节点指向其他节点的边,那么我们很容易将整个 Internet 上的网页建模成一个有向图。理论上,通过遍历算法遍历该图,可以访问到Internet 上的几乎所有的网页。最简单的遍历就是宽度优先以及深度优先。以下笔者实现的简易爬虫就是使用了宽度优先的爬行策略

    图 2. 网页关系的建模图

    简易爬虫实现流程

    在看简易爬虫的实现代码之前,先介绍一下简易爬虫爬取网页的流程。

    图 3. 爬虫流程图

    各个类的源码以及说明

    对应上面的流程图,简易爬虫由下面几个类组成,各个类职责如下:

    Crawler.java:爬虫的主方法入口所在的类,实现爬取的主要流程。

    LinkDb.java:用来保存已经访问的 url 和待爬取的 url 的类,提供url出对入队操作。

    Queue.java: 实现了一个简单的队列,在 LinkDb.java 中使用了此类。

    FileDownloader.java:用来下载 url 所指向的网页。

    HtmlParserTool.java: 用来抽取出网页中的链接。

    LinkFilter.java:一个接口,实现其 accept() 方法用来对抽取的链接进行过滤。

    下面是各个类的源码,代码中的注释有比较详细的说明。

    清单6 Crawler.java

    package com.ie;

    import java.util.Set;

    public class Crawler {

    /* 使用种子 url 初始化 URL 队列*/

    private void initCrawlerWithSeeds(String[] seeds)

    {

    for(int i=0;i

    LinkDB.addUnvisitedUrl(seeds[i]);

    }

    /* 爬取方法*/

    public void crawling(String[] seeds)

    {

    LinkFilter filter = new LinkFilter(){

    //提取以 http://twt.edu.cn 开头的链接

    public boolean accept(String url) {

    if(url.startsWith("http://twt.edu.cn" alt="基于Java HttpClient和Htmlparser实现网络爬虫代码" title="基于Java HttpClient和Htmlparser实现网络爬虫代码" width="200" height="150">

    基于Java HttpClient和Htmlparser实现网络爬虫代码

    API接口管理 •2023-07-24

    基于Java HttpClient和Htmlparser实现网络爬虫代码开发环境的搭建,在工程的 Build Path 中导入下载的Commons-httpClient3.1.Jar,htmllexe...

    代码 Java 开源 参数 http
  • 详解Java的Struts2框架的结构及其数据转移方式

    详解Java的Struts2框架的结构及其数据转移方式

    API接口管理 •2023-07-23

    详解Java的Struts2框架的结构及其数据转移方式Struts2的结构1.为什么要使用框架?(1)框架自动完成了很多琐屑的任务对于Struts2来说,它帮助我们方便地完成了数据类型转换、数据验证、...

    数据 Java 框架 线程 开源
  • 优化你的接口性能测试:探寻HTTP接口测试的步骤与工具

    优化你的接口性能测试:探寻HTTP接口测试的步骤与工具

    用户投稿 •2023-07-22

    在现代软件开发中,HTTP接口测试是至关重要的一环。本文将深入探讨测试HTTP接口的步骤和工具,帮助您优化接口性能,保障系统稳定与高效。HTTP接口在软件开发中扮演着重要角色,确保系统的稳定性、可靠性...

    接口测试 接口 工具 输出 开源
  • MPAndroidChart开源图表库的使用介绍之饼状图、折线图和柱状图

    MPAndroidChart开源图表库的使用介绍之饼状图、折线图和柱状图

    API接口管理 •2023-07-21

    MPAndroidChart开源图表库的使用介绍之饼状图、折线图和柱状图MPandroidChart开源图表库之饼状图为大家介绍一款图标开源库MPAndroidChart,它不仅可以在Android设...

    开源 api Java 集合 项目
  • Bootstrap每天必学之日期控制

    Bootstrap每天必学之日期控制

    API接口管理 •2023-07-20

    Bootstrap每天必学之日期控制一个成熟的框架,日期控制是少不了的,在网上也有很多日期控制可以选择,而主框架用了bootstrap,日期控制也当前要用它自己的,控件地址:http://bootht...

    控制 开源 框架 参数 引用