情報アイランド

「情報を制する者は世界を制す」をモットーに様々な情報を提供することを目指すブログです。現在はプログラミング関連情報が多めですが、投資関連情報も取り扱っていきたいです。

cheerioの使い方――HTML要素のHTMLを取得する

cheerioモジュールの基本的な使用方法に関しては下の記事を参照してください。

HTMLの取得

$が表すHTMLドキュメントのHTML要素のHTMLを取得するには$.html関数を使用します。

var html = $.html('xxx');

第1引数にCSSセレクタを指定します。この引数は指定しなくても構いません。

返り値として$が表すHTMLドキュメントでCSSセレクタに合致するHTML要素のHTMLが得られます。

ただし、第1引数のCSSセレクタを指定しなかった場合にはHTMLドキュメント全体のHTMLが返ります

また、CSSセレクタに合致するHTML要素が複数存在する場合には全てのHTML要素のHTMLを順番に結合したものが返ります

サンプルコード1

cheerio-html.js

var cheerio = require('cheerio');

var $ = cheerio.load(`
<!DOCTYPE html>
<html>
    <head>
        <meta charset="UTF-8">
        <title>title</title>
    </head>
    <body>
        <p id="p1" class="odd">paragraph 1</p>
        <p id="p2" class="even">paragraph 2</p>
        <p id="p3" class="odd">paragraph 3</p>
        <p id="p4" class="even">paragraph 4</p>
        <p id="p5" class="odd">paragraph 5</p>
    </body>
</html>
`);

console.log($.html());
console.log($.html('.odd'));

使用パッケージ

  • cheerio
    npm install cheerioでインストールします。

実行結果

C:\work\node>node cheerio-html.js

<!DOCTYPE html>
<html>
        <head>
                <meta charset="UTF-8">
                <title>title</title>
        </head>
        <body>
                <p id="p1" class="odd">paragraph 1</p>
                <p id="p2" class="even">paragraph 2</p>
                <p id="p3" class="odd">paragraph 3</p>
                <p id="p4" class="even">paragraph 4</p>
                <p id="p5" class="odd">paragraph 5</p>
        </body>
</html>

<p id="p1" class="odd">paragraph 1</p><p id="p3" class="odd">paragraph 3</p><p id="p5" class="odd">paragraph 5</p>

関連

pizyumi
プログラミング歴19年のベテランプログラマー。業務システム全般何でも作れます。現在はWeb系の技術を勉強中。
スポンサーリンク

-Node.js