Научно-технический вебинар «Обучение машинному синтезу путем автоматического чтения миллионов научных публикаций»

30 ноября 2021, 16:00 MCK

О вебинаре

  • Спикер

    Оля Кононова, Ройвант Саенсес, Нью-Йорк, США

  • Тема

    Научно-технический вебинар «Обучение машинному синтезу путем автоматического чтения миллионов научных публикаций»

  • Подробнее про вебинар

    Спикер о работе: На вебинаре мы будем обсуждать проект, над которым я работала в докторантуре Калифорнийского университета в Беркли. Мы построили автоматизированный конвейер анализа текста, который обрабатывает научные публикации и извлекает из них информацию о синтезе материалов. Применяя этот конвейер к ~ 5 млн статей, мы собрали набор данных из ~ 70 тыс. реакций синтеза керамики, принадлежащих к различным типам. Мы использовали этот набор данных для исследования условий синтеза распространенных классов материалов.

    Дополнительная информация:
    Kononova et al. «Opportunities and challenges of text mining in materials research», iScience 24, 2021, https://doi.org/10.1016/j.isci.2021.102155
    Kononova et al. «Text-mined dataset of inorganic materials synthesis recipes», Sci. Data 6, 2019, https://www.nature.com/articles/s41597-019-0224-1

     

    Дополнительные ссылки на то, что обсуждалось на вебинаре:
    1. Статья о words embeddings trained on materials science papers by Vahe Tchitoyan: https://www.nature.com/articles/s41586-019-1335-8
    2. Статья из группы A. Norquist’a about mining jab journals: https://www.nature.com/articles/nature17439
    3. Статья by T. Sparks group насчет материалов и экономики ресурсов: https://pubs.acs.org/doi/10.1021/cm400893e
    4. Наиболее полный обзор о text mining in biochemistry and organic synthesis: https://pubs.acs.org/doi/abs/10.1021/acs.chemrev.6b00851 — by Martin Krallinger. Другие группы: Lee Cronin (Edinburg), Alán Aspuru-Guzik (Toronto), Marwin Segler (Microsoft), Connor Coley (MIT).
    5. https://matscholar.com/ и https://covidscholar.org/ — поисковики статей.