精华内容
下载资源
问答
  • Python之新闻分类

    千次阅读 多人点赞 2020-04-22 17:51:04
    新闻分类 背景 新闻分类是文本分类中常见的应用场景。传统的分类模式下,往往是通过人工对新闻进行核对,从而将新闻进行分类。但是这种方式效率不高。 能够对文本数据进行预处理 能够通过Python统计词频,生成...

     

    新闻分类

    背景

    新闻分类是文本分类中常见的应用场景。传统的分类模式下,往往是通过人工对新闻进行核对,从而将新闻进行分类。但是这种方式效率不高。

    • 能够对文本数据进行预处理
    • 能够通过Python统计词频,生成词云图
    • 能够通过方差分析,进行特征选择。
    • 能够根据文本内容,对文本数据进行分类。

    1、加载数据集

    import numpy as np
    import pandas as pd
    import matplotlib.pyplot as plt
    import matplotlib
    import warnings
    
    plt.rcParams["font.family"] = "SimHei"
    plt.rcParams["axes.unicode_minus"] = False
    plt.rcParams["font.size"] = 15
    warnings.filterwarnings("ignore")
    %matplotlib inline
    
    news = pd.read_csv("./news.csv", encoding="utf-8")
    display(news.head())

    2、数据预处理

    2.1 缺失值处理

    news.info()

    ##使用新闻标题填充缺失的新闻内容
    index = news[news.content.isnull()].index
    news["content"][index]=news["headline"][index]  
    news.isnull().sum()

    2.2 重复值处理

    ###自定义背景
    wc = WordCloud(font_path=r"C:\Windows\Fonts\STFANGSO.ttf", mask=plt.imread("./imgs/map3.jpg"))
    
    plt.figure(figsize=(15,10))
    img = wc.generate_from_frequencies(c)
    plt.imshow(img)
    plt.axis("off")
    print(news[news.duplicated()])

    news.drop_duplicates(inplace=True)

    2.3 文本内容清洗

    import re  ####文本的处理 sub调用编译后的正则对象对文本进行处理
    re_obj = re.compile(r"['~`!#$%^&*()_+-=|\';:/.,?><~·!@#¥%……&*()——+-=“:’;、。,?》《{}':【】《》‘’“”\s]+")
    
    def clear(text):
        return re_obj.sub("", text)
    news["content"] = news["content"].apply(clear)
    
    news.sample(10)

    2.4 分词

    import jieba
    def cut_word(text):   ###分词,使用jieba的lcut方法分割词,生成一个列表,
        ####cut()  生成一个生成器, 不占用空间或者说占用很少的空间,使用list()可以转换成列表
        return jieba.lcut(text)
    
    news["content"] = news["content"].apply(cut_word)
    news.sample(5)

     2.5 停用词处理

    def get_stopword():####删除停用词,就是在文中大量出现,对分类无用的词 降低存储和减少计算时间
        s = set()   ###通过hash处理后的键映射数据    列表则是通过下标的顺序存储映射数据
        with open("./stopword.txt", encoding="utf-8") as f:
            for line in f:
                s.add(line.strip())
        return s         
    
    def remove_stopword(words):
        return [word for word in words if word not in stopword]
    
    stopword = get_stopword()
    news["content"] = news["content"].apply(remove_stopword)
    news.sample(5)

     3、数据探索

    3.1 类别数量分布

    ###数据探索  描述性分析
    ###tag统计
    t = news["tag"].value_counts()
    print(t)
    t.plot(kind="bar")

    3.2 年份统计

    ###年份数量分布  指定expand=True生成DataFrame
    """
    str.split()有三个参数:第一个参数就是引号里的内容:就是分列的依据,可以是空格,符号,字符串等等。
    第二个参数就是前面用到的expand=True,这个参数直接将分列后的结果转换成DataFrame。
    第三个参数的n=数字就是限制分列的次数。
    如果我想从最右边的开始找分列的依据,可以使用rsplit(),rsplit和split()的用法类似,
    一个从右边开始,一个从左边开始。
    """
    t = news["date"].str.split("-", expand=True)
    
    t2 = t[0].value_counts()
    t2.plot(kind="bar")

    3.3 词汇统计

    ###词汇统计
    
    ##词汇频数统计
    
    from itertools import chain
    from collections import Counter
    
    li_2d = news["content"].tolist()  ###转二维数组
    
    ###二维数组转一维数组
    li_1d = list(chain.from_iterable(li_2d))
    print(f"词汇总量:{len(li_1d)}")
    c = Counter(li_1d)
    print(f"不重复词汇数量:{len(c)}")
    print(c.most_common(15))

    common = c.most_common(15)
    d = dict(common)
    plt.figure(figsize=(15,5))
    plt.bar(d.keys(), d.values())

     3.4 生成词云图

    ###词云图
    
    from wordcloud import WordCloud
    
    wc = WordCloud(font_path=r"C:\Windows\Fonts\STFANGSO.ttf", width=800, height=600,  background_color='green')
    join_word = " ".join(li_1d)   ####词云图需要以空格的格式产生
    img = wc.generate(join_word)
    plt.figure(figsize=(15,10))
    plt.imshow(img)
    plt.axis("off")
    wc.to_file("wordcloud.png")  

    #自定义背景
    wc = WordCloud(font_path=r"C:\Windows\Fonts\STFANGSO.ttf", mask=plt.imread("./imgs/map3.jpg"))
    
    
    plt.figure(figsize=(15,10))
    img = wc.generate_from_frequencies(c)
    plt.imshow(img)
    plt.axis("off")

    4、文本向量化

    将文本转换为数值特征向量的过程,称为文本向量化。将文本向量化,可以分为如下步骤:

    • 对文本分词,拆分成更容易处理的单词
    • 将单词转换为数值类型。

    4.1 词袋模型

    词袋模型是一种能够将文本向量化的方式。在词袋模型中,每一个文档为一个样本,每个不重复的单词为一个特征,单词在文档中出现的次数作为特征值。

    4.2 TF-IDF

    有些单词,我们不能仅以当前文档中的频数来进行衡量,还要考虑其在语料库中,在其他文档中出现的次数。

    TF 词频,指一个单词在文档中出现的次数。

    IDF 逆文档频率

    计算方式为:

    from sklearn.feature_extraction.text import CountVectorizer
    count = CountVectorizer()
    docs = [
        "Where there is a will, there is a way",
        "There is no royal road to learning."
    ]
    bag = count.fit_transform(docs)
    ###bag 是一个稀疏的矩阵
    
    print(bag)
    ###调用toarray()方法,将稀疏矩阵转换成稠密矩阵
    print(bag.toarray())

     

    print(count.get_feature_names())###特征
    print(count.vocabulary_)  ###单词和编号的映射关系

    ​
    from sklearn.feature_extraction.text import CountVectorizer
    count = CountVectorizer()
    docs = [
        "Where there is a will, there is a way",
        "There is no royal road to learning."
    ]
    bag = count.fit_transform(docs)
    ###bag 是一个稀疏的矩阵
    
    print(bag)
    ###调用toarray()方法,将稀疏矩阵转换成稠密矩阵
    print(bag.toarray())

    from sklearn.feature_extraction.text import TfidfVectorizer
    
    docs = [
        "Where there is a will, there is a way",
        "There is no royal road to learning."
    ]
    tfidf = TfidfVectorizer()
    t = tfidf.fit_transform(docs)
    print(t.toarray())

    5、建立模型

    5.1 构建训练集和测试集

    ##文本向量化需要传递空格分开的字符串数组类型
    
    def join(text_list):
        return " ".join(text_list)
    news["content"] = news["content"].apply(join)
    news["tag"] = news["tag"].map({"详细全文": 0, "国内":0, "国际":1})
    news["tag"].value_counts()
    from sklearn.model_selection import train_test_split
    
    X = news["content"]
    y = news["tag"]
    
    X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.25)

    5.2 特征选择

    vec = TfidfVectorizer(ngram_range=(1, 2))####考虑二维的特征 临近的两个特征组合
    
    X_train_vec = vec.fit_transform(X_train)
    X_test_vec = vec.transform(X_test)
    display(X_train_vec, X_test_vec)

     5.2.1 方差分析

    使用词袋模型向量化后,会产生过多的特征,这些特征会对存储与计算造成巨大的压力,同时,并非所有的特征对建模有帮助。

    使用方差分析来进行特征选择。

    from sklearn.feature_selection import f_classif
    
    
    #根据y进行分组,计算X中,每个特征的F值与P值
    #F值越大,P值越小。
    f_classif(X_train_vec, y_train)

     

    from sklearn.feature_selection import SelectKBest
    
    X_train_vec = X_train_vec.astype(np.float32)
    X_test_vec = X_test_vec.astype(np.float32)
    selector = SelectKBest(f_classif, k=min(20000, X_train_vec.shape[1]))
    selector.fit(X_train_vec, y_train)
    
    X_train_vec = selector.transform(X_train_vec)
    X_test_vec = selector.transform(X_test_vec)
    print(X_train_vec.shape, X_test_vec.shape)

     5.3 逻辑回归

    from sklearn.linear_model import LogisticRegression
    from sklearn.model_selection import GridSearchCV
    from sklearn.metrics import classification_report
    param=[{"penalty":["l1","l2"],"C":[0.1,1,10],"solver":["liblinear"]},
          {"penalty":["elasticnet"],"C":[0.1,1,10],"solver":["saga"], "l1_ratio":[0.5]}]
    
    gs = GridSearchCV(estimator=LogisticRegression(), param_grid=param, cv = 5, scoring="f1",n_jobs=-1,verbose=10)
    
    gs.fit(X_train_vec, y_train)
    
    print(gs.best_params_)
    y_hat = gs.best_estimator_.predict(X_test_vec)
    print(classification_report(y_test,y_hat))

    5.4 朴素贝叶斯

    from sklearn.naive_bayes import GaussianNB, BernoulliNB, MultinomialNB, ComplementNB
    
    from sklearn.pipeline import Pipeline
    
    from sklearn.preprocessing import FunctionTransformer
    
    ###定义函数转换器,将稀疏矩阵转换成稠密矩阵
    
    steps = [("dense",FunctionTransformer(func=lambda X:X.toarray(), accept_sparse=True)),
            ("model", None)]
    pipe = Pipeline(steps=steps)
    param = {"model":[GaussianNB(), BernoulliNB(), MultinomialNB(), ComplementNB()]}
    
    gs = GridSearchCV(estimator=pipe, param_grid=param, cv=5, scoring="f1", n_jobs=-1,verbose=10)
    gs.fit(X_train_vec, y_train)
    gs.best_estimator_.predict(X_test_vec)
    print(classification_report(y_test, y_hat))

     

    展开全文
  • 在搜索引擎类的网站中作为聚合新闻频道使用,应用比较广泛。RSS还被大量的新起网站当作力推的重点,这种免编辑的新闻模式,不仅被人们看成是一种新业务的金矿,而且实实在在的节省成本。整体看来,RSS处在“主流”...
  • RFID行业十大新闻解读.docx
  • 解读信息时代的独家新闻.pdf
  • 新闻规范解读及图片选择.ppt
  • 解读信息时代如何做好报纸新闻编辑工作.pdf
  • 用jQuery写新闻标题轮播图解读

    千次阅读 2018-03-21 11:37:53
    3.滚动的新闻标题的内容其实是存在于列表中,竖着排列的,只是超出大盒子的部分被隐藏了(overfloe:hidden;),为了方便看出不同的效果,此处给每一个li设置了不同的背景颜色。4.轮播图的运动是基于绝对定...

    1.先构造轮播图的外部框架,写一个固定的盒子,为了方便查看效果,我给这个盒子添加了外边框属性(border)。

    2.在index.html文件中引入jQuery文件,将写好的css样式引入。

    3.滚动的新闻标题的内容其实是存在于列表中,竖着排列的,只是超出大盒子的部分被隐藏了(overfloe:hidden;),为了方便看出不同的效果,此处给每一个li设置了不同的背景颜色。

    4.轮播图的运动是基于绝对定位之上的,如果是上下滚动,变的是top的值;如果是左右滚动,变的是left的值。

    5.此时要考虑如果滚动到最后一个li时,如何让他从第一个开始继续轮播,且不出现闪动的状态呢?此时就是需要利用人的视觉差,比如本来需要展示的是4个标题,那么你就要写5个li,第五个li的内容与第一个一致。写一个全局变量,用来存放当前的li的序号,当这个全局变量的值等于最后一个li的数值时,让其等于1,同时将top值修改为0,这样内容就会从第一个开始,,且从视觉上来看是连续的轮播。

    6.每一次的运动的top值都是之前li的高度乘以需要隐藏的数量。用定时器控制自动轮播的时间。

    <script>
            $(function () {
                var c = 0;
                var timer = setInterval(function () {
                    c++;
                    if(c == 4){
                        $(".box ul").css({"top":'0px'});
                        c = 1;
                    };
                    var t = c*-35;
                    $(".box ul").stop().animate({'top':t+'px'},1000);
                },1000);
            });
    </script>

    7.也可以加上鼠标移入,滚动暂停,移出继续执行。

    $(".box ul").stop().mouseenter(function () {
    clearInterval(timer);
    });

    8.css样式如下:

    * {
        margin: 0;
        padding: 0;
    }
    
    .box {
        width: 400px;
        height: 35px;
        position: relative;
        margin: 20px auto;
        border: 2px solid #4ecc0e;
        overflow: hidden;
    }
    .box ul {
        width: 400px;
        position: absolute;
        top: 0;
    }
    
    .box ul li {
        list-style: none;
        width: 400px;
        height: 35px;
        line-height: 35px;
        text-align: center;
     }

    9.页面布局如下:

    <body>
    <div class="box">
        <ul>
            <li style="background-color: #ffc9e6">毛毛很可爱</li>
            <li style="background-color: #93faba">萌萌哒</li>
            <li style="background-color: #f850fa">美美哒</li>
            <li style="background-color: #35dcff">酷酷滴</li>
            <li style="background-color: #ffc9e6">我很可爱</li>
            <li style="background-color: #ffc9e6">毛毛很可爱</li>
    
        </ul>
    </div>

    10.效果图:



    展开全文
  • 互联网时代下的新闻娱乐化现象浅析:《娱乐至死》新解读.pdf
  • 互联网的飞速发展,让人们了解信息的方式从传统媒体转变到了网络媒体的方式,网络使得现在的新闻信息的时效性变得非常强,所以现在越来越多的传媒公司都把新闻传播的重点放在了网络连接的地方。 企业新闻稿所带来...

    互联网的飞速发展,让人们了解信息的方式从传统媒体转变到了网络媒体的方式,网络使得现在的新闻信息的时效性变得非常强,所以现在越来越多的传媒公司都把新闻传播的重点放在了网络连接的地方。

    企业新闻稿所带来的好处主要有以下几点:

    1、利用媒体让用户了解企业的信息,增加企业的曝光度;

    2、通过大量权威报道,塑造品牌良好形象;

    3、新闻稿一经发布就不会轻易被删除,传播时间也长,为日后消费者了解企业打下了夯实的基础;

    创启传媒凭借多年的新闻稿发布经验,总结出企业新闻稿主要包括以下五点内容:

    一、品牌塑造

    塑造品牌形象是虚无缥缈的事情,所以在一开始,这件事情并没有想象的那么容易,他是一份长期的工作,并不是一蹴而就的,在新闻稿中塑造品牌形象可以介绍企业的相关荣誉,参加过的活动,或者企业的过去,现在和未来,让企业看上去有内涵,有发展。但是在塑造品牌形象的时候,最忌讳的就是夸大其词,新闻稿要符合事实,因为新闻稿的真实性也是很重要的。

    二、企业代言人

    一个成熟的企业都会有特定的企业文化,如果不了解企业内部的文化,那么从企业代言人身上也可以体现出来。创启传媒在这里说的代言人不一定是名人明星之类的,代言人可以是企业的创始人,这样的人不会像传统企业家一样身居幕后,神秘莫测,像京东的刘强东,阿里的马云,他们的一举一动都会被人们所关注,名气并不低于那些大明星。

    三、产品信息

    新闻稿可以很好的包装企业形象,但是新闻稿写得再好,没有给到用户实质性的东西也是白搭,意思就是说,要给用户详细说明产品的信息,让更多人了解产品信息,提升产品的销量。

    四、行业科普

    作为一个行业小白,突然间去选择该行业的产品是十分困难的,若一个企业的定位是行业的领航者,那么它的新闻稿便可以从行业科普这方面来撰写,不仅提升了企业影响力,还能在消费者心中刷足好感。

    五、企业公关

    如果企业有了一定的知名度,那么紧随而来的就是负面新闻,现在的网络是全开放的时代,你不能保证你在网络上的信息全部都是正面评价,当负面消息出现的时候,企业公关就成为了第一任务,借助新闻稿的传播性和时效性,发布大量企业正面信息,这样比企业本身在原地呐喊要有效得多。

    (责编:创启传媒|PRcreative)

    展开全文
  • 日常生活中看新闻是习以为常的行为,但很多读者都忽视了其实看新闻的过程中,不仅可以获取资讯知识,还能让你的时间变得更有价值。 最近发现了一款能培养你阅读新闻习惯的app — 大众看点,这款app不仅能可以看...

      日常生活中看新闻是习以为常的行为,但很多读者都忽视了其实看新闻的过程中,不仅可以获取资讯知识,还能让你的时间变得更有价值。

     

      

     

      最近发现了一款能培养你阅读新闻习惯的app — 大众看点,这款app不仅能可以看新闻,而且还能在看新闻的过程中完成每天的任务就会有一些奖励,在持续阅读和享受奖励的过程中,形式了良性的阅读好习惯。

     

      对于市场上很多产品行业app只是以噱头的标题吸引用户下载,用户使用后而没有得到真的回馈奖励,大众看点这个看新闻让客户时间变得更有价值,新闻奖励活动是持续下去的,用户反馈提现门槛是业内最低,速度较快,总体用户体验不错,得到了网民的赞同支持。

     

     

      小编特意使用了一段时间,app 全方位体验,从产品的界面设计、使用流畅度,阅读新闻和视频内容的质量度,以及完成活动任务丰富度,三大维度去体验 。

     

    产品交互流畅,个性化定制

     

      产品界面简洁,但功能齐全,个性化定制阅读,让用户更好容易地获取到想要的内容资讯,智能筛选推送给用户感兴趣的内容,拒绝滥竽充数;用户的使用时间越长,智能系统推荐越精准,极简的人机交互让用户体验度更高。

     

     

    l 内容质量高24小时持续更新

     

    新闻资讯质时效性更新得快,24小时更新,大众看点每日更新海量新闻资讯,国家大事随时看热点资讯触手可及,身边小事及时知道,集合热点推荐、国际、社会、娱乐、时尚等海量新闻看点和优质视频内容;

    各种头条趣闻,聚焦天下时事,看点在手热点都有。最近世界杯板块栏目有很多媒体报道,社会热点资讯多;视频栏目板块有趣的段子,搞笑的娱乐综艺,丰富多彩。

     

    活动奖励丰富

     

    重要的是在不知不觉的过程中,完成了多项日常奖励任务,阅读奖励,产生了收益性的金币奖励。另外收取徒弟增加阅读奖励分成也是趣味性玩法之一,奖励多多;金币兑换提现到微信支付宝快捷方便。

    下面的奖励图可供参考,虽然网上各种教你如何使用大众看点看新闻赚钱的教程案例也挺多,但都没有详细介绍过。

     

    收集过整理资料,经测试过:只要有10个活跃徒弟下线,一个月能赚150-200元人民币。(主要还是看徒弟质量)

     

     

    当然,如果用户还会推广的情况下,在当收取到徒弟下线的时候马上有奖励,而且当用户的徒弟阅读新闻文章视频的时候,用户还有额外的收益奖励,这个可是很轻松赚钱的事。

     

    在现在移动互联网社交软件丰富的时代,无论是谁想要收10来个徒弟都是一件很轻松的事,只要发动一下身边认识的人就能轻松搞定了,如果有推广渠道或是有推广能力的朋友,可以利用QQ、微信群、朋友圈、贴吧论坛等方式转发进行推广大众看点,做好了肯定能有一份非常不错的收入。

     

    软件的简单介绍:

     

    打开页面大众看点,用刚刚的手机号码登录,然后就可以阅读自己喜欢的新闻资讯。打开你感兴趣的新闻,左下角有计时的表,当计时表满格后就会奖励你相应的金币。

     

     

    看视频来获得金币


     

     

    每天签到和完成日常任务可以获得一定量的金币

     

    获得一定量的金币后,你可以兑换金钱。

      


    展开全文
  • 论文解读者:北邮 GAMMA Lab 硕士生 李晨题目:Graph Neural News Recommendation with Long-term and Short-termI...
  • 数据新闻的四大发展特点

    千次阅读 2019-11-26 14:30:31
    数据新闻作为一种新兴的跨学科、跨领域的新闻生产方式,正在改变着人们阅读和认识世界的方式。在数据信息日渐增多的中国,数据新闻也得到了迅速的发展。 “互联网之父”蒂姆·伯纳斯·李这样描述过新闻未来的方向,...
  • 马敏【摘 要】在數字化与互联网技术发展的今天,新闻制作、报道与互联网技术的关系越来越密切,从网络新闻的制作再到创新形式以动新闻的视频制作展示再到运用html5技术制作动画新闻,我们的新闻报道形式日渐发展。...
  • 解读AI.pdf

    2019-09-24 14:18:47
    今天,有太多的新闻报道是关于机器学习算法的应用问题,从癌症检查预测到图像理解、自然语言处理,人工智能正在赋能并改变着这个世界。 现代人工智能的历史具备成为一部伟大戏剧的所有元素。在最开始的 1950 年代,...
  • 上上上次组会研一学长汇报了一篇数据集文章:MIND: A Large-scale Dataset for News Recommendation,是微软为新闻推荐而发布的一个数据集。在听汇报时我发现这个数据集非常符合我的需求: 首先,新闻推荐需要处理...
  • 本文研究的主要是linux下swap分区的相关内容,具体介绍如下。 swap分区介绍 嵌入式Linux中文站消息,Linux系统的Swap分区,即交换区,Swap空间的作用可简单描述为:当系统的物理内存不够用的时候,就需要将物理内存...
  • 在科学技术日新月异的时代中,数据与媒体行业间的联系也日益紧凑,计算机设备在社会各个行业中得到广泛应用,并使信息处理方式发生一定变动,使各类新闻数据信息的采集、梳理与分析效率均有不同程度的提升,强化信息...
  • [解读小程序]灵犀新闻客户端

    千次阅读 2016-09-28 11:57:04
    [解读小程序]灵犀新闻客户端分析的程序来源: https://my.oschina.net/u/1012086/blog/751455 作者: 黄秀杰 OsChina地址: http://git.oschina.net/dotton/news/tree/master 其实该代码的作者的博文里面已经写的很...
  • 解读《大话西游之大圣娶亲》

    千次阅读 2018-11-13 12:10:20
    《大话西游之大圣娶亲》这部影片很多人都看过,相信你看的时候肯定笑的合不拢嘴。如果观后只当喜剧一笑而过,其实...欢迎订阅公众号:每日推送数据结构、算法、面试经验、每日新闻、闲散趣文等。一起学习进步!
  • 此外,新闻推荐还面临着新闻高时效性和用户兴趣动态多样性的挑战。 提出: 为了解决上述问题,本文提出了一种将知识图谱表示融合到新闻推荐中的深度知识感知网络(DKN)。DKN是一个基于内容的深度推荐框架,用于预测...
  • 新闻管理系统》数据库设计_参考答案《数据库原理及应用》课程设计——《新闻管理系统》数据库设计(参考答案)题目解读:系统功能需求:新闻按栏目分类(只有一级栏目),每条新闻可归属多个栏目,每个栏目有多条新闻。...
  • 移动互联网环境下HTML5新闻编辑特点分析移动互联网环境下HTML5新闻编辑特点分析摘 要 针对近年来快速发展的HTML5新闻进行分析,从文本内容、表达结构、传授关系三个方面分析HTML5新闻事件结构与可视化、线性呈?...
  • 2019全球数据新闻奖揭晓

    千次阅读 2019-06-16 12:40:55
    大数据文摘授权转载自RUC新闻坊编辑:刘长宇、刘畅、段钇男、葛书润、肖鳕桐、姚思妤、欧阳婕、马冰莹2019年全球数据新闻奖于当地时间6月14日(北京时间6月15日)在希腊揭晓,本次评选共收到参赛作品607件,经过初选...
  • CNN论文解读

    千次阅读 2019-03-20 21:00:57
    论文解读 论文:ImageNet Classification with Deep Convolutional Neural Networks 论文连接:点击打开链接,百度网盘:点击打开链接 翻译如下: 摘要: 我们训练了一个大型的深层卷积神经网络来对120万个进行...
  • 中国移动端新闻资讯营销策略研究报告.pdf
  • (本文阅读时间:8 分钟)编者按:数字信息时代人们获取新闻的方式越来越高效,但是获取新闻中关键信息的效率却很低。而 NLP 领域的新闻标题生成任务 (News Headline Gener...
  • 2019 年 8 月,北京智源人工智能研究院联合中科院计算所、数据评测平台 biendata,共同发布了中文多模态虚假新闻数据集,并同步开放了评测竞赛(2019 年 8 ...
  • 中国移动端新闻资讯头部用户内容消费洞察报告.pdf
  • 可信区块链推进计划副理事长、溯源组组长、智链万源CEO董宁在峰会中分享《可信区块链溯源标准解读》的权威报告,从宏观层面探讨区块链与实体经济融合的最佳路径,从微观层面介绍区块链技术在溯源领域的落地与应用,...
  • 动态新闻标题热点分析 背景描述 基本上每天都会发生一些令社会热议的热点新闻舆情事件,我通过python针对这些热点新闻舆情事件热点词汇进行了盘点,汇总并展示热点词可视化,供各位参考。 为完成该项工作,我将应用...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 14,869
精华内容 5,947
关键字:

怎么解读新闻