Web ページ中の表の読み取り †MATLAB で html を拾ってくる関数は webread や urlread などがある. urlreadtable †MATLAB の中の人が開発した urlreadtable が便利. T = urlreadtable(url) とするだけで,うまいことやってくれる. urlreadtable の使用例 †気象庁の潮位推算地点の一覧表をなんとか MATLAB で使える table 型にしたかった. clear close all %% reference url url = 'https://www.data.jma.go.jp/kaiyou/db/tide/suisan/station2024.php'; %% read T = urlreadtable(url); T = T{1}; T(:,9:end) = []; T(1:2,:) = []; %% rename vars ncol = size(T,2); for j = 1:ncol T = renamevars(T,T.Properties.VariableNames{j},strrep(T.Properties.VariableNames{j},sprintf('web%d',j),'')); end %% TP補正できない地点を除く ind = table2array(rowfun(@(x) isempty(x{1}),T(:,"潮位表基準面の標高(cm)"))); T(ind,:) = []; ind = table2array(rowfun(@(x) strcmp(x,'-'),T(:,"潮位表基準面の標高(cm)"))); T(ind,:) = []; clear ind %% セル{文字列} から数値に変換 Ttmp = rowfun(@(x) str2double(x{1}),T(:,"潮位表基準面の標高(cm)")); T{:,"潮位表基準面の標高(cm)"} = table2cell(Ttmp); Ttmp = rowfun(@(x) str2double(x{1}),T(:,"MSLの標高(cm)")); T{:,"MSLの標高(cm)"} = table2cell(Ttmp); Ttmp = rowfun(@(x) str2double(x{1}),T(:,"MSL潮位表基準面(cm)")); T{:,"MSL潮位表基準面(cm)"} = table2cell(Ttmp); %% 緯度経度を10進法に nrow = size(T,1); lon_all = zeros(nrow,1); lat_all = zeros(nrow,1); for i = 1:nrow londm = str2double(strrep(split(string(table2cell(T(i,"経度(東経)"))),"゜"),"'","")); lon_all(i) = londm(1) + londm(2)/60; latdm = str2double(strrep(split(string(table2cell(T(i,"緯度(北緯)"))),"゜"),"'","")); lat_all(i) = latdm(1) + latdm(2)/60; end T{:,"経度(東経)"} = table2cell(array2table(lon_all)); T{:,"緯度(北緯)"} = table2cell(array2table(lat_all)); 上記を実行すると下の図のようなテーブルが作成される.ちなみにこの一覧表の緯度経度情報は度分までしかなく,秒がわからないので位置はあまりあてにならない(結構困る). |