Predictive Analytics in the Public Sector

shutterstock_218879485-700x467My colleague Rainer Kattel (Tallinn University of Technology, Tallinn) and I are in the process of conducting interviews on digital transformation in the Estonian government. By coincidence we came across an interesting practice: the use of Big Data to review customs and financial data streams with the goal to reduce corruption. I wrote this up as a short contribution for the German Behörden Spiegel – a newspaper for public managers.

Here is the text (adapted from the German version – scroll down for the original text):

Big Data are Internet-generated data from online interactions of humans with websites or passive data collection by computer networks or physical sensors.The resulting data sets are usually defined as “big” because of its size, the speed in which they are generated, and the possibilities for predictive analytics and real-time insights into behavioral preferences of citizens.

Traditionally, public sector organizations are operating mostly with administratively designed and collected that results out of the direct interactions with citizens, includes other government records, and mostly includes data sets, such as open data, or other transactional data. It usually goes through an extensive cleaning and analysis process until it is made available with significant time delays (in the case of census data even years of delay). Oftentimes, the use of this ‘old’ data is used for predictive analytics to project the potential needs of citizens. Big Data however are automatically generated data sets, unstructured, and matching it with administrative data requires significant effort to match them with administrative data for the use by public managers.

Using the example of the Estonian customs and tax services, Big Data analytics can help to fight corruption in near real-time. Based on standardize cash flows, the Estonian tax and customs analysts have created risk profiles for different types of organizations. Every company is matched up with one of the profiles. These are continuously compared to cash flows and daily updates and adjustments are done in case of minor deviations. In addition to the risk profiles, so-called Key Performance Indicators in combination with additional data sets, such as banking transactions, invoices, business registers, lang register entries,, etc. In addition, data from online auction sites are used to find out if sellers are paying their sales taxes.

In case of anomalies between the expected tax incomes and the risk profiles of companies, based on a predefined algorithm, warnings are sent to the analytics team. After a first review, they decided what Information to forward to the specialists who will conduct their own ad hoch investigations. Using the analytical assessment in combination with the specialists’ experiences and assessments, a more detailed risk assessment is derived. As a result, either the risk profile is adjusted, or auditors are launching a tax examination on site on the same day.

This type of real-time analysis and timely interpretation of large-scale data sets allows the Estonian tax and customs authorities to assess information about the current tax situation and potential corruption cases in real time.

In the future, predictive analytics tool can be used to identify patterns about the health of individual companies. Predictive analytics can be used to understand the potential economic and social impact in case of impending bankruptcies. Using big data analytics can help government make more effective and efficient decisions, be potentially better prepared and act preventatively.

===================

Here is the full text in German and a link to the article.

Korruptionsbekämpfung in Echtzeit

Big Data sind Internet-generierte Daten, die sich aus den Onlineinteraktionen von Menschen mit Webseiten und physischen Sensoren ergeben. Die resultierenden Datensätze, die allgemein aufgrund ihrer Größe, der Schnelligkeit ihrer Erstellung und den daraus resultierenden Möglichkeiten zur Echtzeitanalyse definiert werden, erlauben der öffentlichen Verwaltung Einsichten in die Bedürfnisse und tatsächlichen Handlungen von Bürgern. Sie stellen eine Kombination aus Social Media-Daten wie geteilten Videos und Fotos, likes/shares, Onlinebanking, Onlineeinkäufen, und Mobilfunkdaten dar.

Traditionell arbeitet die öffentliche Veraltung mit administrativ designten und aufwendig gesammelten Datensätzen, die vor allem aus den direkten Interaktionen mit Bürgern entstehen. Administrative Daten können einem Vorgang und individuellen Personen oder Haushalten zugeordnet werden. Beispiele dafür sind Zensusdaten, oder bisherige bearbeitete Fälle, die in Kombination mit professionellem Verständnis der Beamten für sogenannte predictive analytics dazu genutzt werden zukünftige Trends vorherzusagen. Dagegen werden Big Data-Datensätze automatisch generiert, sind unstrukturiert, und bedürfen hohem Einsatz um die Daten für die öffentliche Verwaltung nutzbar zu machen.

In Kombination können Big Data und administrative Daten dazu beitragen die Fachaufgabe der öffentlichen Verwaltung effizienter und effektiver zu gestalten. Dies zeigt sich am Beispiel der Estländischen Steuerbehörden, die Big Data-Analysen einsetzen um schnell Steuerhinterziehung zu identifizieren um möglichst noch am gleichen Tag die Ermittlungen vor Ort einzuleiten.

Die Zoll- und Finanzbeamten haben basierend auf standardisierten Finanzströmen für unterschiedliche Unternehmensformen zunächst sogenannte Risikoprofile angelegt, die mit echten Finanzdaten getestet werden, und kontinuierlich – wenn notwendig sogar täglich – dem tatsächlichen Geschäftsgebaren angepasst werden. Zusätzlich zu den Risikoprofilen dienen sogenannte Key Performance Indicators – Leistungskennzahlen – in Kombination mit den weiteren Datensätzen wie z.B. Banküberweisungen, Rechnungen, Unternehmensregister, Grundbucheinträgen. Aber auch Daten von Internet-Autobörsen werden miteinbezogen, um herauszufinden ob Verkäufer ihre Einkommen versteuern.

Sobald sich Abweichungen zu den steuerpflichtigen Finanzströmen ergeben, die dem Profil des Unternehmens nicht entsprechen, werden aufgrund der vordefinierten Algorithmen Warnungen an das Analyseteam geschickt, die die Daten mit ihrer eigenen Einschätzung an die Fachabteilung weitergeleiten. In Kombination mit den fachlichen Einschätzungen der Fachbehörden und den durch die Risikoanalyse entsteht somit eine klarere Risikoeinschätzung, die die Steuer- und Zollbehörden nutzen um weitere Schritte einzuleiten. Entweder werden die Risikoprofile des Unternehmens auf die neue Situation angepasst, so dass keine Warnungen mehr entstehen, oder Betriebsprüfer leiten Kontrollen noch am gleichen Tag ein.

Diese Art der Echtzeitanalyse und –interpretation von großen Datenströmen erlaubt es den Estnischen Steuer- und Zollbehörden Informationen über die gegenwärtige Steuersituation des Landes zu ermitteln. Zukünftig können die bereits etablierten Tools auch dafür genutzt werden um aus den in den Finanzströmen erkennbaren Mustern vorherzusehen, ob es einem Unternehmen schlecht gehen wird. Predictive analytics können dann auch dazu beitragen die Belastungen des Staates und das Aufkommen potentieller sozialer Probleme frühzeitig zu erkennen und eventuell präventiv einzugreifen – zumindest vorbereitet zu sein.

 

Professor Dr. Ines Mergel ist Professorin für Public Administration an der Universität Konstanz wo sie zu Themen der Digitalen Transformation der öffentlichen Verwaltung forscht und lehrt. Kontakt: ines.mergel@uni-konstanz.de

Advertisements

About Ines Mergel

I am Full Professor of Public Administration at the Department of Politics and Public Administration at University of Konstanz, Germany. Previously, I served as Assistant and then Associate Professor (with tenure) at the Maxwell School of Citizenship and Public Affairs, Syracuse University, NY. In my research, I focus on informal social networks in the public sector and the adoption and diffusion of digital service innovations in government organizations. I teach classes on social media management, digital government, public management, and social network analysis.

One thought on “Predictive Analytics in the Public Sector

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s