img タグなどの src 部分を抽出 (sed 実験室)

sed で HTML の img タグ内などにある src="" 部分の URL を抽出する例。

sed -e 's/.*src *= *"\([^"]\+\)".*/\1/' in.txt > out.txt

= の前後に、スペースを認めるために、[スペース]* があります。[^"]\+ は、" を含まない 1 文字以上の文字の並びを表します。sed -e では、+ の前に、\ が必要です。\(\) の間にマッチした文字列が、\1 により出力されます。

となりのページ

このサイトについて

このサイトのページへのリンクは自由に行っていただいてかまいません。
このサイトで公開している全ての画像、プログラム、文書の無断転載を禁止します。

連絡先

ここをクリック すると表示されるページから作者へメールで連絡できます。

共有