Tweepy错误代码400

问题描述 投票:7回答:3

我试图下载一些推文用于研究目的,代码工作得很好,直到几天前。

错误信息

> Traceback (most recent call last):
> 
>   File "<ipython-input-1-10547a7aea4c>", line 1, in <module>
>     runfile('F:/twitter_locations_n_scraper/02_twitterscrapping.py', wdir='F:/twitter_locations_n_scraper')
> 
>   File
> "C:\ProgramData\Anaconda3\lib\site-packages\spyder_kernels\customize\spydercustomize.py",
> line 668, in runfile
>     execfile(filename, namespace)
> 
>   File
> "C:\ProgramData\Anaconda3\lib\site-packages\spyder_kernels\customize\spydercustomize.py",
> line 108, in execfile
>     exec(compile(f.read(), filename, 'exec'), namespace)
> 
>   File "F:/twitter_locations_n_scraper/02_twitterscrapping.py", line
> 70, in <module>
>     for item in cursor.items(1000): # Remove the limit to 1000
> 
>   File "C:\ProgramData\Anaconda3\lib\site-packages\tweepy\cursor.py",
> line 49, in __next__
>     return self.next()
> 
>   File "C:\ProgramData\Anaconda3\lib\site-packages\tweepy\cursor.py",
> line 197, in next
>     self.current_page = self.page_iterator.next()
> 
>   File "C:\ProgramData\Anaconda3\lib\site-packages\tweepy\cursor.py",
> line 108, in next
>     data = self.method(max_id=self.max_id, parser=RawParser(), *self.args, **self.kargs)
> 
>   File "C:\ProgramData\Anaconda3\lib\site-packages\tweepy\binder.py",
> line 250, in _call
>     return method.execute()
> 
>   File "C:\ProgramData\Anaconda3\lib\site-packages\tweepy\binder.py",
> line 234, in execute
>     raise TweepError(error_msg, resp, api_code=api_error_code)
> 
> TweepError: Twitter error response: status code = 400

我确实尝试了所谓的解决方案

api.update_status('Test')

但这对我不起作用,我确实更改了键,但我仍面临同样的错误,重新安装Tweepy包两次,但错误没有。

感谢解决错误的帮助,提前谢谢。

更新:我收到错误的代码

import tweepy
from tweepy import Stream
from tweepy import OAuthHandler
from tweepy.streaming import StreamListener
import pandas as pd
import json
import csv
import sys
import time

path="F:\\twitter_locations_n_scraper\\"


ckey = '*****'
csecret = '******'
atoken = '*****'
asecret = '*****'

def toDataFrame(tweets):
    # COnvert to data frame
    DataSet = pd.DataFrame()

    DataSet['tweetID'] = [tweet.id for tweet in tweets]
    DataSet['tweetText'] = [tweet.text.encode('utf-8') for tweet in tweets]
    DataSet['tweetRetweetCt'] = [tweet.retweet_count for tweet in tweets]
    DataSet['tweetFavoriteCt'] = [tweet.favorite_count for tweet in tweets]
    DataSet['tweetSource'] = [tweet.source for tweet in tweets]
    DataSet['tweetCreated'] = [tweet.created_at for tweet in tweets]
    DataSet['userID'] = [tweet.user.id for tweet in tweets]
    DataSet['userScreen'] = [tweet.user.screen_name for tweet in tweets]
    DataSet['userName'] = [tweet.user.name for tweet in tweets]
    DataSet['userCreateDt'] = [tweet.user.created_at for tweet in tweets]
    DataSet['userDesc'] = [tweet.user.description for tweet in tweets]
    DataSet['userFollowerCt'] = [tweet.user.followers_count for tweet in tweets]
    DataSet['userFriendsCt'] = [tweet.user.friends_count for tweet in tweets]
    DataSet['userLocation'] = [tweet.user.location for tweet in tweets]
    DataSet['userTimezone'] = [tweet.user.time_zone for tweet in tweets]
    DataSet['Coordinates'] = [tweet.coordinates for tweet in tweets]
    DataSet['GeoEnabled'] = [tweet.user.geo_enabled for tweet in tweets]
    DataSet['Language'] = [tweet.user.lang for tweet in tweets]
    tweets_place= []
    #users_retweeted = []
    for tweet in tweets:
        if tweet.place:
            tweets_place.append(tweet.place.full_name)
        else:
            tweets_place.append('null')
    DataSet['TweetPlace'] = [i for i in tweets_place]
    #DataSet['UserWhoRetweeted'] = [i for i in users_retweeted]

    return DataSet

OAUTH_KEYS = {'consumer_key':ckey, 'consumer_secret':csecret,'access_token_key':atoken, 'access_token_secret':asecret}
#auth = tweepy.OAuthHandler(OAUTH_KEYS['consumer_key'], OAUTH_KEYS['consumer_secret'])
auth = tweepy.AppAuthHandler('******', '*******')

api = tweepy.API(auth, wait_on_rate_limit=True,wait_on_rate_limit_notify=True)

if (not api):
    print ("Can't Authenticate")
    sys.exit(-1)
else:
    df=pd.read_csv(path+"00_all_location_India_full.csv")

    print ("Scraping data now") # Enter lat and long and radius in Kms
    for i in range(0,len(df)):
        x="%s,%s,30km"%(df['latitude'][i],df['longitude'][i]) #,q='motox4', since='2018-08-16',until='2018-08-18',
        cursor = tweepy.Cursor(api.search,since='2018-08-23',until='2018-08-24',lang='en',count=1000)
        results=[]
        print (i)
        for item in cursor.items(1000): # Remove the limit to 1000
            results.append(item)
        DataSet = toDataFrame(results)
        DataSet['latitude']=df['latitude'][i]
        DataSet['longitude']=df['longitude'][i]
        DataSet['radius']=30
        del DataSet['Coordinates']
        DataSet.to_csv(path+'cities_aug23.csv',encoding='utf-8',index=False,mode="a")
python anaconda tweepy
3个回答
1
投票

这是一个有趣的问题,实际上,你写问题的方式让我写出这个答案,

你提到它有效但不再有,所以这可能发生在我看来有两个原因......

浏览器已经在浏览器中折旧某些功能,阻止脚本工作。也许你应该尝试在页面加载时使用preventDefault()函数,看看是否出现任何错误。尝试更改您的互联网连接,或重新启动您的调制解调器还要确保您从https网站加载此而不是http。

或者你在代码中列出的这些路径,可能没有权限访问权限读取它,我对这条路径有很大的疑虑,但是你检查所有路径并尝试关闭任何可能阻止与这些路径连接的东西。

C:\ ProgramData \ Anaconda3 \ LIB \

因为它需要Windows身份验证才能访问它。尝试从控制面板最小化您的UAC权限。您也可以通过右键单击文件夹并选择属性来检查安全选项卡。

所以,按原样恢复所有内容并检查以上内容。请让我知道结果,因为我可以根据你的重播结果进行编辑

希望我的帖子可以帮助你。


1
投票

根据twitter官方api页面。代码400表示以下错误,因此您的问题是由以下列出的原因之一引起的,请逐一检查:

-attachment_url参数无效与HTTP 400对应。提供的URL值不是可以附加到此Tweet的URL。

-Bad身份验证数据与HTTP 400对应。该方法需要身份验证,但未显示或完全无效。

-parameter无效与HTTP 400对应。提供的URL值不是可以附加到此Tweet的URL。

-Bad请求请求无效或无法以其他方式提供。随附的错误消息将进一步解释。没有身份验证的请求被视为无效,并将产生此响应。

- 上传多张图片时不允许使用动画GIF。与HTTP 400对应。只有一个动画GIF可以附加到单个推文上

- 媒体ID的验证失败。与HTTP 400对应。使用Tweet提交的媒体ID存在问题。

- 找不到媒体ID。与HTTP 400对应。未找到附加到Tweet的媒体ID。

- 给定的URL无效。与HTTP 400对应。无法处理Tweet中包含的URL。这可能是因为无法转换非ASCII URL或出于其他原因。


0
投票

Twitter最近对其API进行了重大更改,删除了Twitter客户端和抓取工具使用的大量功能。由于HTTP 400是“错误请求”,并且您的代码一直工作到最近(当进行更改时)我会说这是相当安全的假设这是原因。见details

© www.soinside.com 2019 - 2024. All rights reserved.