欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

推特开发者之 tweepy库输出省略号解决方法

程序员文章站 2024-03-18 20:20:34
...

tweepy库输出twitter全文,而不是省略号

在使用tweepy库的时候可能有的人会遇到一个问题,明明已经使用了扩展模式,为什么打印出来的full_text还是有省略号?像下面这样:
推特开发者之 tweepy库输出省略号解决方法

说明:

标准API方法
任何tweepy.API返回Status对象的方法都接受一个新 tweet_mode参数。此参数的有效值为compat和 extended,分别提供兼容模式和扩展模式。默认模式(如果未提供任何参数)是兼容模式。

  • 兼容模式
    默认情况下,使用兼容模式,根据需要text将tweepy.API方法返回的Status对象的属性截断为140个字符。发生这种截断时,truncatedStatus对象的属性将为True,并且仅完全包含在可用140个字符范围内的实体将包括在该entities属性中。还可以看出,textStatus对象的属性被截断了,因为该属性的后缀是省略号,空格和到Tweet的缩短的永久链接。

  • 扩展模式
    使用扩展模式时,方法text返回的Status对象的属性将 tweepy.API替换为一个full_text属性,该属性包含Tweet的整个未截断文本。该truncated状态对象的属性会False和entities属性将包含所有的实体。此外,Status对象将具有一个 display_text_range属性,即两个Unicode代码点索引的数组,用于标识Tweet可显示内容的包含性开始和排除性结束。


  • 默认情况下,流中的Status对象可能包含一个extended_tweet 属性,该属性表示Tweet的原始数据/有效负载中的等效字段。该属性/字段仅适用于包含子字段字典的扩展推文。该full_text词典的entities 子字段/关键字将包含Tweet的完整,未截断的文本,并且子字段/关键字将包含完整的实体集。如果存在扩展实体,则extended_entities子字段/键将包含这些实体的完整集合。此外,display_text_range子字段/关键字将包含两个Unicode代码点索引的数组,用于标识Tweet可显示内容的包含性开始和排除性结束。

  • 办理转推
    当将扩展模式与Retweet一起使用时,full_textStatus对象的属性可能会用省略号字符截断,而不是包含Retweet的全文。但是,由于 retweeted_status(作为Retweet的Status对象的)full_text属性本身就是一个Status对象,因此可以改用Retweeted Status对象的属性。

这同样适用于状态对象/有效负载,它们是来自流的转推。来自extended_tweet属性/字段的词典包含一个full_text子字段/键,该 子字段/键可能会被省略号省略。而是可以使用extended_tweet“转发状态”的retweeted_status属性/字段(来自属性/字段)。

例子
给定现有tweepy.API对象并id用于Tweet,以下内容可用于打印Tweet的全文,或者如果是Retweet,则打印Retweeted Tweet的全文:

status = api.get_status(id, tweet_mode="extended")
try:
    print(status.retweeted_status.full_text)
except AttributeError:  # Not a Retweet
    print(status.full_text)

如果status是Retweet,则status.full_text可能会被截断。

此状态事件处理程序用于StreamListener打印Tweet的全文,或者如果是Retweet,则打印Retweeted Tweet的全文:

def on_status(self, status):
    if hasattr(status, "retweeted_status"):  # Check if Retweet
        try:
            print(status.retweeted_status.extended_tweet["full_text"])
        except AttributeError:
            print(status.retweeted_status.text)
    else:
        try:
            print(status.extended_tweet["full_text"])
        except AttributeError:
            print(status.text)

如果status是Retweet,则它将没有extended_tweet属性,并且status.text可能被截断。
--------------------------------------------------------------------------------------------------------------------------------
所以可以写一个on_status函数,

def on_status(status):
    if hasattr(status, "retweeted_status"):  # Check if Retweet
        try:
            print(tweet.created_at, "->", status.retweeted_status.full_text)
        except AttributeError:
            print(tweet.created_at, "->", status.retweeted_status.text)
    else:
        try:
            print(tweet.created_at, "->", status.full_text)
        except AttributeError:
            print(tweet.created_at, "->", status.text)


public_tweets = api.user_timeline(id='LeoDiCaprio', count=100, tweet_mode='extended')
for tweet in public_tweets:
    print("--------------")
    print(tweet.created_at, "->", tweet.full_text)
    on_status(status=tweet)

效果对比:
推特开发者之 tweepy库输出省略号解决方法
推特开发者之 tweepy库输出省略号解决方法
就可以打印出全文了。
详细内容可参考:Extended Tweets

相关标签: Twitter开发者