2010年6月30日水曜日

wget で Web サイトの情報を全てダウンロードする方法

いつか使うかもしれないのでメモ。

$ wget \
--recursive \
--no-clobber \
--page-requisites \
--html-extension \
--convert-links \
--restrict-file-names=windows \
--domains website.org \
--no-parent www.website.org/tutorials/html/
オプション説明
--recursiveDownload the entire Web site.
--no-clobberDon't overwrite any existing files
(used in case the download is interrupted and resumed).
--page-requisitesGet all the elements that compose the page (images, CSS and so on).
--html-extensionSave files with the .html extension.
--convert-linksConvert links so that they work locally, off-line.
--restrict-file-names=windowsModify filenames so that they will work in Windows as well.
--domains website.orgDon't follow links outside website.org.
--no-parentDon't follow links outside the directory tutorials/html/.

参考:
http://www.linuxjournal.com/content/downloading-entire-web-site-wget

● wget, web, 全て, ダウンロード, download, all, entire, スクレイピング

2010年6月29日火曜日

checkinstall

ソースから make したアプリを簡単にパッケージ管理することができるコマンド。
checkinstall

使い方は簡単で、configure、make したあとで、make install の代わりに、下記を実行。

# checkinstall --fstrans=no

これで、rpm, deb ファイルを簡単に生成できます。
あとは、rpm, dpkg コマンドでインストールすれば OK。

● checkinstall, rpm, deb

2010年6月28日月曜日

UUID を調べる方法

HDD とかの UUID を調べる方法。
vol_id コマンドを使うらしいが、Ubuntu 10.04 にはない。

# vol_id -u /dev/sda1

vol_id がない場合は、blkid を使う。

# blkid /dev/sda1

それか、ここを確認する。これが一番確実かも。

$ ls -l /dev/disk/by-uuid

● UUID, 確認, vol_id, blkid, by-uuid

2010年6月2日水曜日

bash で proxy を使う

bash で proxy を使用する方法。
apt-get を proxy 経由で使用したいときは、この設定をしておきます。

1. ~/.bashrc に下記を追加

export http_proxy=http://:/
export ftp_proxy=http://:/

2. 編集後に、source コマンドで設定を反映

$ source ~/.bashrc

sudo で apt-get を実行したい場合は、root のシェルの環境変数に設定されるようにすれば良いです。
どこが正解なんでしょうね? ~root/.bashrc とか、~root/.profile あたりに書いておけばいいのでは?

● bash, proxy, apt-get