精华内容
下载资源
问答
  • 今天突然有一个需求, 第二个页面要显示一个网页,第一个页面要显示图片标题或者简介等内容,但是!后台仅仅返回了一个URL!...这里就不详细说怎么拿到title或者图片之类的了,我的需求是拿到文章内容的文字部分拿来...

    转自:https://blog.csdn.net/qq_29480617/article/details/79791462

    今天突然有一个需求, 第二个页面要显示一个网页,第一个页面要显示图片标题或者简介等内容,但是!后台仅仅返回了一个URL!这就意味着我必须在第一个页面自己通过URL拿到网页内部我需要的内容.这里就不详细说怎么拿到title或者图片之类的了,我的需求是拿到文章内容的文字部分拿来显示三排就够了:

    ①拿到网页内容,很简单一句代码

    NSString *htmlString = [NSString stringWithContentsOfURL:[NSURL URLWithString:@"你的完整URL"] encoding:NSUTF8StringEncoding error:nil];

    ②正则去除网络标签,一个方法

    - (NSString *)getZZwithString:(NSString *)string{
        NSRegularExpression *regularExpretion=[NSRegularExpression regularExpressionWithPattern:@"<[^>]*>|\n" options:0 error:nil];
        string = [regularExpretion stringByReplacingMatchesInString:string options:NSMatchingReportProgress range:NSMakeRange(0, string.length) withTemplate:@""];
        return string;
    }


    ③最后 

    NSString *contentStr = [self getZZwithString:htmlString];


    contentStr就是我要用于显示的文本了.此方法拿到的文本是url对应网页的文本,所以根据需求自由截取长短.

    总结:以上主要是在不需要加载网页的情况下使用的,方便快捷.如果本页面本来就有webView,那就可以通过js代码来获取相应的内容:

    - (void)webViewDidFinishLoad:(UIWebView *)webView {
     
    UIWebView *web = webView;
     
    //获取所有的html
     
    NSString *allHtml = @"document.documentElement.innerHTML";
     
    //获取网页title
     
    NSString *htmlTitle = @"document.title";
     
    //获取网页的一个值
     
    NSString *htmlNum = @"document.getElementById('title').innerText";
     
    //获取到得网页内容
     
    NSString *allHtmlInfo = [web stringByEvaluatingJavaScriptFromString:allHtml];
     
    NSLog(@"%@",allHtmlInfo);
     
    NSString *titleHtmlInfo = [web stringByEvaluatingJavaScriptFromString:htmlTitle];
     
    NSLog(@"%@",titleHtmlInfo);
     
    NSString *numHtmlInfo = [web stringByEvaluatingJavaScriptFromString:htmlNum];
     
    NSLog(@"%@",numHtmlInfo);
     
    }
     
    此处引用流浪在简书的文章( https://www.jianshu.com/p/cfb93f7712a4 )

     

    展开全文
  • 1.google chrome浏览器,点击F12 2.选择Console页签,输入document.body.innerText,按回车即可 注意:出来的文字没有格式,需要复制出来自己整理

    1.google chrome浏览器,点击F12

    2.选择Console页签,输入document.body.innerText,按回车即可

    注意:出来的文字没有格式,需要复制出来自己整理

    展开全文
  • if TButton(Sender).Caption ='开始获取' then begin if startHook(Self.Handle ,MessageID ) then begin TButton(Sender).Caption :='停止获取' ; lbl1.Visible := True; lbl2.Visible := True; ...
  • 转载请声明出处! http://www.cnblogs.com/linguanh/category/633252.html 距离上次 谈 C++ 制作json 或者其他数据传送给 服务器,时隔两个多月。 ... ... 这次是从服务器上 中获取 文字内容到控制台,或...

    转载请声明出处!

    http://www.cnblogs.com/linguanh/category/633252.html

          距离上次 谈 C++ 制作json 或者其他数据传送给 服务器,时隔两个多月。

          链接:http://www.cnblogs.com/linguanh/p/4340119.html

     

          这次是从服务器上 中获取 文字内容到控制台,或者写入本地文本等操作,废话不多说,开讲。

          

    -----------------------------------------------------------分割线-------------------------------------------------------------

          测试服务器是: 新浪云 sea;

          测试内容:获取 由 php 脚步从服务器中 读取出来的 数据,我这里是 微信用户的openID;

          工具:VS 2012;

     

    先上直观的图片,后上文本源码

          总体例子

     

    核心函数

     

     

    对于多字节wchar 到 lpcswtr 的转化函数介绍,请转到 该链接

    http://www.cnblogs.com/linguanh/p/4241939.html

     

     1 #include <iostream>
     2 #include <fstream>
     3 #include <Windows.h>
     4 #include <wininet.h>
     5 #define MAXBLOCKSIZE 28+1 // openID 固定长 28 
     6 #pragma   comment(lib,"wininet.lib") //引入动态库
     7 
     8 char* getWeiXinFromUserNameFromSEA(const char*);
     9 using namespace std;
    10 
    11 int main(){
    12     char *p=NULL; //用于存放返回结果
    13     p=getWeiXinFromUserNameFromSEA("http://913337456-my.stor.sinaapp.com/xxx.txt");
    14 
    15     cout<<p;
    16     return 0 ; 
    17 } 
    18  
    19 //我这里设置了函数 带有 返回值,大家可以不适用返回值!
    20 char* getWeiXinFromUserNameFromSEA(const char *Url){
    21     char *str = new char[MAXBLOCKSIZE]; // 用于最后返回的结果,动态分配
    22     const char *x="From_AF"; int i = 0;//第一个是打开标记,i是下面的转化控制变量 
    23     WCHAR exchange_text_from_url[256],exchange_text_from_x[256];
    24     LPCWSTR py = exchange_text_from_url;// url 转 lpcwstr 的中间变量
    25     LPCWSTR pz = exchange_text_from_x; //另外的信息
    26     //unicode编码 下的 设置,我这里使用了宽字节,免去转换的麻烦
    27     MultiByteToWideChar( 0, 0,x, -1,exchange_text_from_x, 64 );//WCHAR to LPCWSTR,转化
    28     MultiByteToWideChar( 0, 0,Url, -1, exchange_text_from_url, 256 );
    29     //结束转化
    30     HINTERNET handle_for_init_internet = InternetOpen("From_AF", INTERNET_OPEN_TYPE_DIRECT, NULL, NULL, 0);
    31      if (handle_for_init_internet != NULL){
    32          HINTERNET handle_for_read_info = InternetOpenUrl(handle_for_init_internet, Url, NULL,NULL,NULL,NULL);
    33          if (handle_for_read_info != NULL){
    34              char result[MAXBLOCKSIZE]; //用于保存 缓冲区的数据组合
    35              char buffer[MAXBLOCKSIZE];//下载文件的缓冲区
    36              DWORD bytes_read = 1;//下载的字节数
    37              BOOL temp_boolean;
    38              while(bytes_read!=0){ 
    39                  //使用 InternetReadFile 从缓存区 读取 数据到 buffer 字符串,要度的字节数是 buffer的有效长度,控制是 bytes_read
    40                  temp_boolean = InternetReadFile(handle_for_read_info,buffer,sizeof(buffer), &bytes_read);       
    41              }
    42              for(i;i<MAXBLOCKSIZE-1;i++){
    43                  if(i==MAXBLOCKSIZE-2 && buffer[i]=='0'){ //去掉最后的干扰值 0
    44 
    45                  }else if(buffer[i]>=34 && buffer[i]<=126){ //多种测试,最终还是使用 ASCII 码范围判断来解决了 烫烫烫~~~~
    46                     //cout<<buffer[i]; //通过使用循环 针对性地 输出单个 字符消除缓冲区的其他混杂 空量
    47                     //这里不直接搞出 buffer 是因为,缓存区里有很多 不知什么数据在输出的时候会变成很多烫,一般是空才会有烫
    48                      result[i]=buffer[i];  //经过测试,这个逐个赋值能够去掉 其中夹杂的 烫~~~
    49                  }
    50              } 
    51              result[i]='\0'; //赋值 结尾 符,防止 自身爆 烫
    52              strcpy(str,result); //copy 给 字符串指针,用于返回
    53              //安全操作,销毁句柄
    54              InternetCloseHandle(handle_for_read_info); handle_for_read_info = NULL;
    55          }
    56          InternetCloseHandle(handle_for_init_internet); handle_for_init_internet = NULL;
    57          return str;
    58     } 
    59 }

     

    转载于:https://www.cnblogs.com/linguanh/p/4543836.html

    展开全文
  • 今天突然有一个需求, 第二个页面要...这里就不详细说怎么拿到title或者图片之类的了,我的需求是拿到文章内容的文字部分拿来显示三排就够了:①拿到网页内容,很简单一句代码NSString *htmlString = [NSString stringW...

    今天突然有一个需求, 第二个页面要显示一个网页,第一个页面要显示图片标题或者简介等内容,但是!后台仅仅返回了一个URL!这就意味着我必须在第一个页面自己通过URL拿到网页内部我需要的内容.这里就不详细说怎么拿到title或者图片之类的了,我的需求是拿到文章内容的文字部分拿来显示三排就够了:

    ①拿到网页内容,很简单一句代码NSString *htmlString = [NSString stringWithContentsOfURL:[NSURL URLWithString:@"你的完整URL"] encoding:NSUTF8StringEncoding error:nil];

    ②正则去除网络标签,一个方法- (NSString *)getZZwithString:(NSString *)string{

    NSRegularExpression *regularExpretion=[NSRegularExpression regularExpressionWithPattern:@"]*>|\n" options:0 error:nil];

    string = [regularExpretion stringByReplacingMatchesInString:string options:NSMatchingReportProgress range:NSMakeRange(0, string.length) withTemplate:@""];

    return string;

    }

    ③最后NSString *contentStr = [self getZZwithString:htmlString];

    contentStr就是我要用于显示的文本了.此方法拿到的文本是url对应网页的文本,所以根据需求自由截取长短.

    总结:以上主要是在不需要加载网页的情况下使用的,方便快捷.如果本页面本来就有webView,那就可以通过js代码来获取相应的内容:- (void)webViewDidFinishLoad:(UIWebView *)webView {

    UIWebView *web = webView;

    //获取所有的html

    NSString *allHtml = @"document.documentElement.innerHTML";

    //获取网页title

    NSString *htmlTitle = @"document.title";

    //获取网页的一个值

    NSString *htmlNum = @"document.getElementById('title').innerText";

    //获取到得网页内容

    NSString *allHtmlInfo = [web stringByEvaluatingJavaScriptFromString:allHtml];

    NSLog(@"%@",allHtmlInfo);

    NSString *titleHtmlInfo = [web stringByEvaluatingJavaScriptFromString:htmlTitle];

    NSLog(@"%@",titleHtmlInfo);

    NSString *numHtmlInfo = [web stringByEvaluatingJavaScriptFromString:htmlNum];

    NSLog(@"%@",numHtmlInfo);

    }

    展开全文
  • 已搬迁至 http://www.cnblogs.com/linguanh/p/4543836.html 转载于:https://www.cnblogs.com/linguanh/p/4525744.html
  • 获取网页图片/文字

    2015-01-02 11:28:42
    输入一个http://打头的网址可以获取网页的图片和文字,由于是学习交流用的,并不是产品,所以没做验证。hao123等大部分网站可用。
  • 获取网页页面选中的文字 2.填充至指定文本框 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Title</title> <script src="../jQuery-...
  • javascript网页获取文本选中文字内容
  • 网页文字抓取工具是一款用于抓取网页文字的软件,一键获取网页文字,快来下载体验吧。 软件功能 网页禁止复制文字怎么办?通过网页“源代码”获取文字又得手工去掉html代码很麻烦,如何解决?请使用“网页文字抓取...
  • 爬取网页文字内容

    2020-11-19 09:18:10
    @ApiOperation(value = "获取网页文字内容") @SysLog("获取网页文字内容") @GetMapping("/getUrlContent") public Res<String> getUrlContent(String url) throws IOException { Resp<JSONObject> ...
  • iOS 抓取网页数据,获取网页图片和文字,iOS 抓取网页数据,获取网页图片和文字
  • //脚本获取网页中选中文字var word = document.selection.createRange().text; //获取选中文字所在的句子var range = document.selection.createRange();range.expand("sentence");var sentence = range.text; ...
  • 获取页面中选中的文字 //获取页面中选中的文字 function getSelectedText(){ if(window.getSelection){ //FF return window.getSelection().toString(); }else{ //IE return document.selection.cr...
  • VB获取网页文字的链接地址

    千次阅读 2009-11-24 21:31:00
    题目: 如何获取网页文字的链接地址 窗口有WebBrowser1,和一个Text1 现在 Private Sub Form_Load() WebBrowser1.Navigate "http://www.baidu.com" End Sub 打开窗体显示百度的首页,要求滑动鼠标到“新闻”时 ...
  • 这里和 获取链接略有不同,不是得到链接到url,而是获取每个链接的文字内容#!/opt/yrd_soft/bin/python importre importurllib2 importrequests importlxml frombs4importBeautifulSoup url='...
  • 分别用三种方法获取网页的所有连接,其中,方法一可以获取网页的所有连接和连接文字
  • Demo地址:http://download.csdn.net/detail/u012881779/8831835获取网页上所有图片、获取所有html、获取网页title、获取网页内容文字。。。.h 文件 代码://网页 //NSString *strPath = [NSString stringWithFormat...
  • [IOS]获取网页上数据(图片、文字、视频) Demo地址:http://download.csdn.net/detail/u012881779/8831835 获取网页上所有图片、获取所有html、获取网页title、获取网页内容文字。。。 //网页 //...
  • } } 嵌入一个简单的网页 获取网页中鼠标选中文字</span> 获取网页中鼠标选中文字 效果图: 效果图2.1 结语 以上所述是给大家介绍的js获取网页鼠标选中文字,主要涉及到window.getSelection这个属性,想了解详细用法...
  • 获取网页上所有图片、获取所有html、获取网页title、获取网页内容文字。。。 .h 文件 代码: //网页 //NSString *strPath = [NSString stringWithFormat:@"http://www.baidu.com/s?wd=%@...
  • 用idhttp:uses IdHTTP; function GetWebPage(const Url :string; IsUtf8 :Boolean = False):string; var idp :TIdHTTP; begin Result := ‘’; idp := TIdHTTP.Create(Application); try idp.HandleRedirects :=......

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,564
精华内容 625
关键字:

获取网页文字