HTMLとスタイルが混同したHTMLからHTMLファイルとCSSファイルを分離するモジュールとか書いてます。

ソース
https://github.com/S2/css_scraper

とりあえずなんとか動きはしたのでペタリ。

<body>
    aaaaa
</body>

<div id="wrapper" style="width:100px;height:150px">
    bbbbbbbbbbbb:
    <div class = "hoge" style="width:100px;height:1550px">
        bbbbbbbbbbbb:
    </div>
    <div style="width:100px;height:150px">
        bbbbbbbbbbbb:
    </div>
</div>

<div id="wrapper2" style="width:1000px;height:150000px;">
    <div class = "hoge" style="width:100px;height:150px">
        bbbbbbbbbbbb:
    </div>
    <div style="width:100px;height:150px">
        bbbbbbbbbbbb:
    </div>
</div>

こんなファイルから

<html>
    <head>
    </head>
    <body>
         aaaaa 
        <div id="wrapper">
             bbbbbbbbbbbb: 
            <div class="hoge">
                 bbbbbbbbbbbb: 
            </div>
            <div class="class_1">
                 bbbbbbbbbbbb: 
            </div>
        </div>
        <div id="wrapper2">
            <div class="hoge">
                 bbbbbbbbbbbb: 
            </div>
            <div class="class_2">
                 bbbbbbbbbbbb: 
            </div>
        </div>
    </body>
</html>

こんなHTMLと

#wrapper2{
    width : 1000px;
    height : 150000px;
}

#wrapper{
    width : 100px;
    height : 150px;
}

.class_1{
    width : 100px;
    height : 150px;
}

.class_2{
    width : 100px;
    height : 150px;
}

.hoge{
    width : 100px;
    height : 150px;
}

こんなCSSに分離するコード書いてたりした。