[解決済み】TypeError: re.findall()でバイトのようなオブジェクトに文字列パターンを使用することはできません。）

2022-01-10 16:31:49

質問

ページのタイトルを取得したいのですが、以下のようなコードです。

import urllib.request
import re

url = "http://www.google.com"
regex = r'<title>(,+?)</title>'
pattern  = re.compile(regex)

with urllib.request.urlopen(url) as response:
   html = response.read()

title = re.findall(pattern, html)
print(title)

実行すると、エラーが発生します。

Traceback (most recent call last):
  File "path\to\file\Crawler.py", line 11, in <module>
    title = re.findall(pattern, html)
  File "C:\Python33\lib\re.py", line 201, in findall
    return _compile(pattern, flags).findall(string)
TypeError: can't use a string pattern on a bytes-like object

解決方法は？

html（バイトのようなオブジェクト）を文字列に変換するために .decode は、例えば html = response.read().decode('utf-8') .

参照バイトをPythonの文字列に変換する

[解決済み】TypeError: re.findall()でバイトのようなオブジェクトに文字列パターンを使用することはできません。）

質問

解決方法は？

関連

Pythonの非常に便利な2つのデコレーターを解説

Python Decorator 練習問題

Pythonを使って簡単なzipファイルの解凍パスワードを手作業で解く

[解決済み】OSError: [WinError 193] %1 は有効な Win32 アプリケーションではありません。

[解決済み】Django: ImproperlyConfigured: SECRET_KEY 設定は空であってはならない

[解決済み】SyntaxError: デフォルト以外の引数がデフォルトの引数に続く

[解決済み] バイトを文字列に変換する

[解決済み] どうすれば、文字列中のリテラルな中抜き文字を印刷し、また.formatを使用することができるのでしょうか？

[解決済み] Python 3で文字列をバイトに変換する最良の方法？

[解決済み] TypeError: Python3でファイルへの書き込み時に'str'ではなくbytesのようなオブジェクトが要求される

最新

nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)

htmlページでギリシャ文字を使うには

ピュアhtml+cssでの要素読み込み効果

純粋なhtml + cssで五輪を実現するサンプルコード

ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード

タイピング効果を実現するピュアhtml+css

htmlの選択ボックスのプレースホルダー作成に関する質問

html css3 伸縮しない画像表示効果

トップナビゲーションバーメニュー作成用HTML+CSS

html+css 実装サイバーパンク風ボタン

おすすめ

python string splicing.join()とsplitting.split()の説明

Python機械学習Githubが8.9Kstarsに達したモデルインタープリタLIME

PyQt5はユーザーログインGUIインターフェースとログイン後のジャンプを実装しています。

Python LeNetネットワークの説明とpytorchでの実装

[解決済み】ImportError: sklearn.cross_validation という名前のモジュールがない。

[解決済み】ilocが「IndexError: single positional indexer is out-of-bounds」を出す。

[解決済み】OSError: [WinError 193] %1 は有効な Win32 アプリケーションではありません。

[解決済み】Python Error: "ValueError: need more than 1 value to unpack" （バリューエラー：解凍に1つ以上の値が必要です

[解決済み】 re.search().TypeError: bytes-like オブジェクトで文字列パターンを使用できない。

[解決済み] バイトを文字列に変換する