<div dir="ltr">Hello Discovery Cluster,<div><br></div><div>Thanks for a great discussion! As promised, I'm sending along a few science of science articles to spark our collective curiosity:</div><div><ul><li><a href="https://www-cs.stanford.edu/~srijan/pubs/paper-citations.pdf">Measuring the Evolution of a Scientific Field through Citation Frames</a><br></li><li><a href="https://www.sciencedirect.com/science/article/abs/pii/S1751157716302255">Discovering discoveries: Identifying biomedical discoveries using citation contexts</a><br></li><li><a href="https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0039464">Design and Update of a Classification System: The UCSD Map of Science</a></li></ul></div><div>I also wanted to add that multi-level topic modeling to cluster similar publications might be worthwhile to explore down the line for the UBD tool. Here's an example of a research map I made with this technique; the position of each document is based on its multiple topics, which are emergent and are labeled by the people who authored the articles (<a href="https://eri-research-dashboard.herokuapp.com/">https://eri-research-dashboard.herokuapp.com/</a>)</div><div><br></div><div>Chris and I also worked with Megan Carter to publicize efforts to contribute to the Usage-Based Discovery tool (<a href="https://www.esipfed.org/collaboration-updates/linking-datasets-to-applications">https://www.esipfed.org/collaboration-updates/linking-datasets-to-applications</a>). </div><div><br></div><div>Finally, I participated in the Coleridge Kaggle competition mentioned earlier (<a href="https://www.kaggle.com/c/coleridgeinitiative-show-us-the-data/">https://www.kaggle.com/c/coleridgeinitiative-show-us-the-data/</a>) and had some luck training a transformer-based NER model with <a href="https://spacy.io/usage/training">spaCy</a> to detect dataset references. My research is ongoing and I'll keep the group posted on progress and useful takeaways.</div><div><br></div><div>Best wishes,<br></div><br clear="all"><div><br></div>-- <br><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><font face="arial, sans-serif"><font color="#000000"><b>Sara Lafia, Ph.D.</b><br></font><font color="#333333">Research Fellow, ICPSR</font></font><div><font face="arial, sans-serif"><a href="http://saralafia.com/" target="_blank">saralafia.com</a></font><font face="arial, sans-serif"><font color="#333333"><br></font></font></div></div></div></div>