自动化pydrive验证过程

问题描述 投票:43回答:5

我正在尝试使用GoogleAuth库(pydrive)自动化https://pypi.python.org/pypi/PyDrive进程。

我已经设置了pydrive和google API,这样我的secret_client.json可以运行,但每次运行我的脚本时都需要进行gdrive访问的Web身份验证:

from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive

gauth = GoogleAuth()
gauth.LocalWebserverAuth()

drive = GoogleDrive(gauth)

textfile = drive.CreateFile()
textfile.SetContentFile('eng.txt')
textfile.Upload()
print textfile

drive.CreateFile({'id':textfile['id']}).GetContentFile('eng-dl.txt')

eng.txt只是一个文本文件。此外,当我登录到另一个帐户时,我尝试使用上面的脚本。它不会将eng.txt上传到生成secret_client.json的gdrive中,但是在我授权身份验证时登录的帐户

从上一篇文章中,我尝试了以下内容来自动执行验证过程,但它给出了错误消息:

import base64, httplib2
from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive

from apiclient.discovery import build
from oauth2client.client import SignedJwtAssertionCredentials
from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive

#gauth = GoogleAuth()
#gauth.LocalWebserverAuth()

# from google API console - convert private key to base64 or load from file
id = "464269119984-j3oh4aj7pd80mjae2sghnua3thaigugu.apps.googleusercontent.com"
key = base64.b64decode('COaV9QUlO1OdqtjMiUS6xEI8')

credentials = SignedJwtAssertionCredentials(id, key, scope='https://www.googleapis.com/auth/drive')
credentials.authorize(httplib2.Http())

gauth = GoogleAuth()
gauth.credentials = credentials

drive = GoogleDrive(gauth)

drive = GoogleDrive(gauth)

textfile = drive.CreateFile()
textfile.SetContentFile('eng.txt')
textfile.Upload()
print textfile

drive.CreateFile({'id':textfile['id']}).GetContentFile('eng-dl.txt')

错误:

Traceback (most recent call last):
  File "/home/alvas/git/SeedLing/cloudwiki.py", line 29, in <module>
    textfile.Upload()
  File "/usr/local/lib/python2.7/dist-packages/pydrive/files.py", line 216, in Upload
    self._FilesInsert(param=param)
  File "/usr/local/lib/python2.7/dist-packages/pydrive/auth.py", line 53, in _decorated
    self.auth.Authorize()
  File "/usr/local/lib/python2.7/dist-packages/pydrive/auth.py", line 422, in Authorize
    self.service = build('drive', 'v2', http=self.http)
  File "/usr/local/lib/python2.7/dist-packages/oauth2client/util.py", line 132, in positional_wrapper
    return wrapped(*args, **kwargs)
  File "/usr/local/lib/python2.7/dist-packages/apiclient/discovery.py", line 192, in build
    resp, content = http.request(requested_url)
  File "/usr/local/lib/python2.7/dist-packages/oauth2client/util.py", line 132, in positional_wrapper
    return wrapped(*args, **kwargs)
  File "/usr/local/lib/python2.7/dist-packages/oauth2client/client.py", line 475, in new_request
    self._refresh(request_orig)
  File "/usr/local/lib/python2.7/dist-packages/oauth2client/client.py", line 653, in _refresh
    self._do_refresh_request(http_request)
  File "/usr/local/lib/python2.7/dist-packages/oauth2client/client.py", line 677, in _do_refresh_request
    body = self._generate_refresh_request_body()
  File "/usr/local/lib/python2.7/dist-packages/oauth2client/client.py", line 861, in _generate_refresh_request_body
    assertion = self._generate_assertion()
  File "/usr/local/lib/python2.7/dist-packages/oauth2client/client.py", line 977, in _generate_assertion
    private_key, self.private_key_password), payload)
  File "/usr/local/lib/python2.7/dist-packages/oauth2client/crypt.py", line 131, in from_string
    pkey = crypto.load_pkcs12(key, password).get_privatekey()
OpenSSL.crypto.Error: [('asn1 encoding routines', 'ASN1_get_object', 'header too long')]

我在gdrive api上的身份验证如下所示:

我怎么能使用pydrive这样我每次使用它时都不需要进行身份验证?

如何允许自动身份验证,以便使用pydrive脚本的python脚本只会上传到生成secret_client.json的帐户,而不是上传到互联网浏览器上当前登录的帐户?

python google-api cloud google-drive-sdk pydrive
5个回答
76
投票

首先,你误解了一个非常重要的一点:

当我在登录其他帐户时尝试使用上述脚本时。它不会将eng.txt上传到生成secret_client.json的gdrive中,而是将我在授权身份验证时登录的帐户

这正是它应该如何工作的。作为开发人员,您将client_secret.json与您的应用程序一起分发,PyDrive使用该文件通过Google对应用程序进行身份验证。谷歌想要知道每个应用程序有多少API请求出于各种原因(指标,收费帐户,撤销访问等),因此它需要应用程序进行身份验证。

现在,当您的应用程序运行LocalWebserverAuth时,它正在使用Google对客户端进行身份验证。当然,客户是实际使用您的应用程序的人。在这种情况下,开发人员和客户是同一个人(您),但想象您希望将您的应用程序分发给数百万不同的人。他们需要能够对自己进行身份验证并将文件上传到他们自己的云端硬盘帐户,而不是让他们全部都在您的(开发人员)中,他们提供了client_secret.json

也就是说,它实际上只是一个非常小的变化,因此您的应用程序无需每次运行应用程序时都要求客户端进行身份验证。你只需要使用LoadCredentialsFileSaveCredentialsFile

from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive

gauth = GoogleAuth()
# Try to load saved client credentials
gauth.LoadCredentialsFile("mycreds.txt")
if gauth.credentials is None:
    # Authenticate if they're not there
    gauth.LocalWebserverAuth()
elif gauth.access_token_expired:
    # Refresh them if expired
    gauth.Refresh()
else:
    # Initialize the saved creds
    gauth.Authorize()
# Save the current credentials to a file
gauth.SaveCredentialsFile("mycreds.txt")

drive = GoogleDrive(gauth)

textfile = drive.CreateFile()
textfile.SetContentFile('eng.txt')
textfile.Upload()
print textfile

drive.CreateFile({'id':textfile['id']}).GetContentFile('eng-dl.txt')

8
投票

另一种方法是通过将setting.yaml文件写入工作目录来使用自定义身份验证流程。此方法效果更好,因为LocalWebserverAuth()将生成一个在一小时内到期的令牌,并且没有刷新令牌。

示例settings.yaml文件如下所示

client_config_backend: file
client_config:
    client_id: <your_client_id>
    client_secret: <your_secret>

save_credentials: True
save_credentials_backend: file
save_credentials_file: credentials.json

get_refresh_token: True

oauth_scope:
    - https://www.googleapis.com/auth/drive
    - https://www.googleapis.com/auth/drive.install

使用此文件,您仍然必须使用浏览器首次完成身份验证,之后将使用刷新令牌在工作目录中生成credentials.json文件。

如果您尝试在服务器上自动化脚本,则此方法可以更好地工作


2
投票

整个线程对我帮助很大,但在我实现了此处提供的所有解决方案后,又出现了一个问题:LocalWebserverAuth()将不会获得刷新令牌。

如果打开实现@dano代码后生成的“mycreds.txt”,您将看到“刷新令牌”将设置为“null”。几个小时后,令牌过期,您得到以下内容,最终必须再次手动进行身份验证。

错误:

raise RefreshError('No refresh_token found.') pydrive.auth.RefreshError: No refresh_token found.Please set access_type of OAuth to offline.

解决方法是强制appro_promt并在GoogleAuth的流程参数上将access_type设置为脱机。

这是我没有错误的方式:

gauth = GoogleAuth()

# Try to load saved client credentials
gauth.LoadCredentialsFile("mycreds.txt")

if gauth.credentials is None:
    # Authenticate if they're not there

    # This is what solved the issues:
    gauth.GetFlow()
    gauth.flow.params.update({'access_type': 'offline'})
    gauth.flow.params.update({'approval_prompt': 'force'})

    gauth.LocalWebserverAuth()

elif gauth.access_token_expired:

    # Refresh them if expired

    gauth.Refresh()
else:

    # Initialize the saved creds

    gauth.Authorize()

# Save the current credentials to a file
gauth.SaveCredentialsFile("mycreds.txt")  

drive = GoogleDrive(gauth)

谢谢你们!


0
投票

如果凭据不到位,此代码将生成一个包含两个选项的输入框:

  • 浏览器身份验证(您只需执行一次)
  • 上传凭证文件(首次选择浏览器身份验证时将生成此文件

现在很容易共享笔记本,它将在不需要授权的情况下运行,因为它将使用本地环境中mycreds.txt中保存的凭据。但是,如果运行时崩溃或重置,该文件将丢失,需要通过上面的输入框再次插入。当然,您可以通过浏览器身份验证再次执行此操作,但如果将mycreds.txt重新分发给使用笔记本的人员,则可以使用“上载”功能将凭据插入到本地环境中。

最后几行仅提供了如何在笔记本中上载和使用经过身份验证的驱动器中的csv文件的示例。

#Install the required packages and fix access to my Google drive account
!pip install pydrive
from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive
from google.colab import auth
from oauth2client.client import GoogleCredentials


#Checks for file with Google authentication key, if the file is not in place, it asks to authenticate via the browser
gauth = GoogleAuth()
if os.path.isfile("mycreds.txt") is False:
    choice = input ("Do you want to: U) Upload authentication file (mycreds.txt). B) Browser authentication (only possible for owner of the connected Google drive folder). [U/B]? : ")
    if choice == "U":
          print ("Upload the mycreds.txt file")
          from google.colab import files
          files.upload()      
    elif choice == "B":
          auth.authenticate_user()
          gauth.credentials = GoogleCredentials.get_application_default()
          gauth.SaveCredentialsFile("mycreds.txt")

gauth.LoadCredentialsFile("mycreds.txt")
if gauth.access_token_expired:
    gauth.Refresh()
else: gauth.Authorize()

#Now you can easily use the files from your drive by using their ID  
drive = GoogleDrive(gauth)
download = drive.CreateFile({'id': '1KRqYpR9cteX-ZIwhdfghju6_wALl4'})
download.GetContentFile('my_data.csv')
data_frame = pd.read_csv('my_data.csv')

0
投票

这只是为了完成@ wang892 post above(我没有足够的声誉来评论)。

这个答案帮助我自动化了我的脚本(每次运行时都不需要重新验证)。

但是当我使用示例settings.yaml文件available in PyDrive documentation时,我遇到了问题(由于我完全无知oauth是如何工作的)。

该示例文件包含这些行,我认为这限制了我的PyDrive脚本只能访问自己创建的文件和文件夹(有关详细信息,请参阅PyDrive issue #122):

访问受限:

oauth_scope:
  - https://www.googleapis.com/auth/drive.file
  - https://www.googleapis.com/auth/drive.install

当我更改这些行时,问题就解决了(我必须删除我存储的凭据并运行脚本重新授权它,再一次)。

使用这些新行,我的脚本现在可以访问我的Google云端硬盘中的所有文件:

完全访问权限

oauth_scope:
  - https://www.googleapis.com/auth/drive

在qazxsw poi中更多关于这一点,这让我很开心。

© www.soinside.com 2019 - 2024. All rights reserved.