Спикер о работе: На вебинаре мы будем обсуждать проект, над которым я работала в докторантуре Калифорнийского университета в Беркли. Мы построили автоматизированный конвейер анализа текста, который обрабатывает научные публикации и извлекает из них информацию о синтезе материалов. Применяя этот конвейер к ~ 5 млн статей, мы собрали набор данных из ~ 70 тыс. реакций синтеза керамики, принадлежащих к различным типам. Мы использовали этот набор данных для исследования условий синтеза распространенных классов материалов.
Дополнительная информация:
Kononova et al. «Opportunities and challenges of text mining in materials research», iScience 24, 2021, https://doi.org/10.1016/ j.isci.2021.102155
Kononova et al. «Text-mined dataset of inorganic materials synthesis recipes», Sci. Data 6, 2019, https://www.nature.com/ articles/s41597-019-0224-1
Дополнительные ссылки на то, что обсуждалось на вебинаре:
1. Статья о words embeddings trained on materials science papers by Vahe Tchitoyan: https://www.nature. com/articles/s41586-019-1335-8
2. Статья из группы A. Norquist’a about mining jab journals: https://www.nature. com/articles/nature17439
3. Статья by T. Sparks group насчет материалов и экономики ресурсов: https://pubs.acs. org/doi/10.1021/cm400893e
4. Наиболее полный обзор о text mining in biochemistry and organic synthesis: https://pubs.acs. org/doi/abs/10.1021/acs. chemrev.6b00851 — by Martin Krallinger. Другие группы: Lee Cronin (Edinburg), Alán Aspuru-Guzik (Toronto), Marwin Segler (Microsoft), Connor Coley (MIT).
5. https://matscholar.com/ и h ttps://covidscholar.org/ — поисковики статей.
Запись: https://youtu.be/ uuK5jjiQBS0