Limita en el tamaño del NFA más pequeño para L_k-distinct


18

Considere el lenguaje consiste en todas las cadenas -letter sobre modo que no haya dos letras iguales: k ΣLkdistinctkΣ

Lkdistinct:={w=σ1σ2...σki[k]:σiΣ  and  ji:σjσi}

Este lenguaje es finito y, por lo tanto, regular. Específicamente, si , entonces \ left | L_ {k-distinct} \ right | = \ binom {n} {k} k! .| L k - d i s t i n c t | = ( n|Σ|=n|Lkdistinct|=(nk)k!

¿Cuál es el autómata finito no determinista más pequeño que acepta este lenguaje?

Actualmente tengo los siguientes límites superiores e inferiores sueltos:

  • El NFA más pequeño que puedo construir tiene 4k(1+o(1))polylog(n) estados.

  • El siguiente lema implica un límite inferior de 2k estados:

Deje que LΣ sea ​​un lenguaje regular. Supongamos que hay n pares P={(xi,wi)1in} modo que xiwjL si y solo si i=j . Entonces, cualquier NFA que acepte L tiene al menos n estados.

  • Otro límite inferior (trivial) es log(nk) , que es el registro del tamaño del DFA más pequeño para el idioma.

También estoy interesado en los NFA que aceptan solo una fracción fija ( 0<ϵ<1 ) de Lkdistinct , si el tamaño del autómata es menor que ϵ4k(1+o(1))polylog(n) .


Editar: Acabo de comenzar una recompensa que tuvo un error en el texto.

Quise decir que podemos asumir k=polylog(n) mientras escribía k=O(log(n)) .

Edit2:

La recompensa terminará pronto, así que si alguien está interesado en lo que quizás sea una forma más fácil de ganarlo, considere el siguiente idioma:

L(r,k)distinct:={w:w contiene k símbolos distintos y ningún símbolo aparece más de r veces } .

(es decir, L(1,k)distinct=Lkdistinct ).

Una construcción similar a la de los comentarios proporciona un autómata de tamaño O(ek2klog(1+r)poly(n)) para L(r,k)distinct .

¿Se puede mejorar esto? ¿Cuál es el mejor límite inferior que podemos mostrar para este idioma?


2
¿Puedes describir tu NFA de límite superior?
mjqxxxx

Todavía no puedo escribir sobre eso, ya que todavía estamos trabajando en ello y no hemos completado la prueba. En cambio, describiré un autómata mucho más simple de tamaño : Tome una familia de hash perfecta . Cada hash de este tipo es una función . Esto significa que para cada subconjunto de de tamaño como máximo , existe una función modo que asigna cada elemento del subconjunto a un número diferente. Después del hash, el alfabeto resultante tiene letras, por lo tanto, un autumaton de tamaño puede aceptar el lenguaje . O((2e)k2O(log(k))log(n))(n,k)Hh:[n][k][n]khHk2kLkdistinct
RB

44
El límite inferior da simplemente contando el número de estados en los que puede estar el NFA después de exactamente pasos. No creo que conozca ningún método de prueba que ofrezca límites significativamente mejores para el tamaño total de lo que se puede obtener que simplemente mirando lo que sucede después de pasos, para algunos . Pero aquí, por cada hay un NFA que puede estar solo en uno de estados después de exactamente estados. (2o(1))kk/2ttt(2+o(1))kt
Noam

3
Prueba (de mi reclamo anterior): El caso más difícil es ; elija diferentes subconjuntos aleatorios (de los símbolos alfabéticos) de tamaño exactamente cada uno y construya un NFA que tenga un estado para cada con alguna ruta que lo lleve a ser el primero símbolos son todos diferentes y están contenidos en , y tiene una ruta de aceptación si los siguientes símbolos son todos diferentes y están contenidos en el complemento de . Un argumento de conteo mostrará que whp (sobre la elección aleatoria det=k/22kpoly(k,logn)SintitSiktSiSi's) este NFA de hecho aceptará todo el lenguaje deseado.
Noam

3
En la construcción anterior, la forma más sencilla de construir el NFA tendrá un estado para cada posible prefijo de longitud y para cada posible sufijo de longitud . En cambio, la parte del prefijo y la parte del sufijo del NFA pueden construirse recursivamente utilizando la misma construcción aleatoria (pero ahora solo dentro de y su complemento, respectivamente) y esto daría un tamaño total . j<tj>ktSi(4+o(1))k
Noam

Respuestas:


2

Esta no es una respuesta, sino un método que creo que dejaría un límite inferior mejorado. Cortemos el problema después de cartas son leídas. Denotar la familia de elemento conjuntos de por y la familia de conjuntos de elementos de por . Denote los estados que se pueden alcanzar después de leer los elementos de (en cualquier orden) mediante y los estados desde los cuales se puede alcanzar un estado de aceptación después de leer los elementos de (en cualquier orden) mediante . Necesitamos que si y solo siaa[n]Ab=ka[n]BASABTBSATBAB= . Esto ya da un límite inferior para el número requerido de estados y creo que podría dar algo no trivial.

Este problema esencialmente requiere un límite inferior en el número de vértices de una hipergrafía cuyo gráfico lineal es (parcialmente) conocido. Problemas similares fueron estudiados, por ejemplo, por Bollobas y existen varios métodos de prueba conocidos que pueden ser útiles.

Actualización 03/24/2014: De hecho si el hypergraph anterior se puede realizar en vértices, entonces nosotros también consigue un protocolo de comunicación complejidad no determinista de la longitud para el sistema de disyunción con entradas de conjuntos de tamaño y (de hecho los dos los problemas son equivalentes) El cuello de botella es, por supuesto, cuando , para esto solo pude encontrar lo siguiente en el libro de Eyal y Noam: demostrado por el argumento probabilístico estándar. Desafortunadamente, no pude (todavía) encontrar límites inferiores lo suficientemente buenos para este problema, pero suponiendo que lo anterior sea nítido, daría un límite inferiorslogsaba=b=k/2N1(DISJa)log(2kloge(na))Ω(2klogn) unificando los dos límites inferiores que ha mencionado.


1
Gracias @domotorp por tu respuesta. Esto se parece mucho a la prueba del lema que he usado para el límite inferior en la pregunta original, pero sin especificar los ' ' , y por lo tanto no es un límite contable. Su comentario sobre la pregunta anterior sugiere que el límite no se puede mejorar con ese método, ¿cree que esto podría mejorar? xiyi2k
RB

3
El punto principal de mi comentario anterior fue que estas técnicas no pueden dar un límite inferior arriba . Esto es realmente lo que hace que este problema sea interesante para mí. (2+o(1))k
Noam

@Noam: Sea k = 2, a = b = 1. Ya entonces obtenemos un límite inferior ya que cada tiene que ser diferente. lognSA
domotorp

1
@domotorp: El oculta un factor : Aquí está el análisis para el peor caso donde : Comience con y fijos y elija al azar un subconjunto de las letras entonces tenemos . Ahora elija tales conjuntos al azar, entonces la probabilidad de que al menos uno de ellos ocurra es . Si elegimos , obtenemos que whp es así para TODOS los conjuntos disjuntos y (de tamañoO ( k log n ) a = b = k / 2 A B S n P r [ A So(1)O(klogn)a=b=k/2ABSn k / 2 S O ( 2 k k log n )Pr[ASandBSc]=2kr2k1exp(r)r=O(log(nk))=O(klogn)ABk/2) El número total de tales en esta construcción es . SO(2kklogn)
Noam

2
@Noam: Lo siento pero nunca he visto un oculto en un , especialmente porque el problema también es interesante en mi opinión para . Pero tienes razón en que RB preguntó sobre . o ( 1 ) k < < log n k = p o l y l o g nlogno(1)k<<lognk=polylogn
domotorp

0

Algunos trabajos en progreso:

Estoy tratando de demostrar un límite inferior de . Aquí hay una pregunta que estoy seguro de que daría un límite inferior: encontrar el mínimo tal que exista una función que conserva la desunión, es decir, que iff . Estoy bastante seguro de que un límite inferior de implicaría casi de inmediato un límite inferior de para nuestro problema. corresponde aproximadamente al conjunto de nodos a los que puede llegar el NFA después de leer los primeros símbolos de la entrada, cuando el conjunto de estos t f : { S [ n ] , | S | = k / 2 } { 0 , 1 } t S 1S 2 = f ( S 1 ) f ( S 2 ) = t 2 k 2 2 k = 4 k f ( S )4ktf:{S[n],|S|=k/2}{0,1}tS1S2=f(S1)f(S2)=t2k22k=4kf(S)k / 2 Sk/2k/2símbolos es .S

Creo que la solución a esta pregunta ya podría conocerse, ya sea en la literatura sobre la complejidad de la comunicación (especialmente en los documentos que tratan el problema de la desunión; tal vez algunos argumentos de rango de matriz ayudarán), o en la literatura sobre codificaciones (por ejemplo, como esta ).


2
Mis comentarios anteriores muestran que este enfoque no puede vencer(2+o(1))n
Noam
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.