Страницы

Поиск по вопросам

суббота, 4 января 2020 г.

Как сохранить html страницу при парсинге

#java #android #jsoup #парсер


Хочу сделать возможность сохранять нужную страницу с интернета в html, чтобы потом
данные парсить офлайн именно с этой страницы, которую сохранил на устройстве. Пользуюсь
библиотекой Jsoup. Помогите пожалуйста, как это можно осуществить.
    


Ответы

Ответ 1



Всё просто. Загружаете страницу. Получаете её в виде HTML кода методом getOutherHtml() класса Element, от коего наследуется, в т.ч. и класс Document. Т.е. вы можете сделать что-то типа String html = Jsoup.connect("http://example.com/").get().getOutherHtml(); Теперь сохраняйте любым способом. В файл, БД, SharedPreferences, как угодно.

Ответ 2



Без использования Jsoup: class DownloadHtmlFromSiteToFile { public static void main(String[] args) { int count; byte[] buff = new byte[64]; InputStream is = null; OutputStream out = null; try { is = new URL("http://google.com").openStream(); out = new FileOutputStream("D:/google.html"); while ((count = is.read(buff)) != -1) { out.write(buff, 0, count); } } catch (IOException e){} }

Комментариев нет:

Отправить комментарий